Bitget App
スマートな取引を実現
暗号資産を購入市場取引先物Bitget Earn広場もっと見る
Google DeepMind、高度なテキストレンダリングとスタジオ品質のビジュアル編集機能を備えたNano Banana Proを発表

Google DeepMind、高度なテキストレンダリングとスタジオ品質のビジュアル編集機能を備えたNano Banana Proを発表

MPOSTMPOST2025/11/21 23:33
著者:MPOST

簡単に言えば Google DeepMind は、高度な推論、強化されたテキスト レンダリング、複数要素の構成などを提供する Nano Banana Pro 画像生成および編集モデルをリリースしました。

テクノロジー企業GoogleのAI部門であるGoogle DeepMindは、画像生成・編集のための次世代モデル「Nano Banana Pro」(通称:Gemini 3 Pro Image)のリリースを発表しました。Gemini 3 Proをベースに開発されたNano Banana Proは、同モデルの高度な推論能力と現実世界の知識を活用し、より正確な視覚表現を生成します。

このモデルは、概念設計、プロトタイプ作成、インフォグラフィック開発、手書きコンテンツの構造化図への変換など、幅広い視覚的タスクをサポートするように設計されています。Nano Banana Proは、強化された推論、外部情報、リアルタイムデータに基づいて、コンテキストアウェアなビジュアルを生成します。 ジェミニ3 の分析能力により、このモデルは、ユーザー提供の資料や現実世界からの検証済み情報に基づいて、有益な教育用グラフィック、詳細な解説、正確なイラストを作成できます。また、Google検索を活用して、レシピ、リアルタイムの天気予報、スポーツ情報などのアイテムを視覚化することもできます。

Nano Banana Proは、画像内のテキストレンダリングをさらに改善し、複数の言語において、より正確で明瞭、そして読みやすさを実現します。このシステムは、短いラベルから長い文章まで、様々なテキストを含むビジュアルの作成をサポートし、文体のニュアンス、深み、レイアウトをより正確に理解します。これにより、モックアップ、ポスター、その他のクリエイティブ素材へのテキストの統合がより正確になり、コンテンツのローカライズや翻訳が可能になり、より幅広い用途に対応できるようになります。

このモデルは、視覚的な忠実性と創造性の柔軟性も向上させます。複数の要素を組み合わせ、最大14枚の画像を組み込むことができ、構図内で最大5人の人物の表現を統一的に維持できる設計となっています。スケッチを製品コンセプトに変換したり、設計図を詳細な3Dスタイルのレンダリングに変換したりする作業は、この向上した一貫性の恩恵を受けます。Nano Banana Proは、拡張されたクリエイティブコントロールを導入し、カメラの視点の調整、フォーカスの変更、画像の特定領域の調整、複雑なカラーグレーディングの適用、照明条件の変更などが可能です。出力は様々なアスペクト比で生成でき、2Kと4Kの解像度をサポートしているため、デジタルと印刷の両方の品質要件を満たすことができます。 

Nano Banana Proがコンシューマー、エンタープライズ、クリエイティブツールで利用可能に

ユーザー数 グーグル の製品とサービスでは、素早く簡単に編集できるように設計されたオリジナルのNano Bananaモデルと、高品質で視覚的に洗練された出力を必要とするより高度な構成向けのNano Banana Proから選択できるようになりました。強化されたモデルは、Geminiアプリの「Thinking」モデルで「画像を作成」を選択することで、一般ユーザーと学生に徐々に提供されるようになります。無料プランのユーザーは、オリジナルバージョンに戻るまでアクセスが制限されますが、Google AI Plus、Pro、Ultraプランの加入者は、拡張された割り当て量を受け取ります。米国では、Nano Banana Proは、Google AI ProおよびUltraプランの加入者が検索のAIモードで利用できるほか、世界中のNotebookLM加入者にも提供されています。

プロフェッショナルユーザー向けに、Google広告はNano Banana Proを統合し、より高度な機能をサポートします。 クリエイティブと編集 世界中の広告主に、このモデルを活用した高度な機能を提供します。このモデルは、Google スライドや Google Vids などの Google Workspace アプリケーションにも展開されます。開発者や企業のお客様は、Gemini API、Google AI Studio、Google Antigravity を通じて Nano Banana Pro を導入し、よりリッチなレイアウトとモックアップの生成が可能になります。企業は、Vertex AI 内でこのモデルを大規模な制作に活用できるようになり、Gemini Enterprise でも提供が予定されています。クリエイティブプロフェッショナルは、同社の AI 映像制作ツールである Flow の Google AI Ultra サブスクリプションを通じてこのモデルにアクセスでき、シーンやビジュアルフレームを形作る際の精度と制御性を向上させることができます。

Googleは、AI生成メディアの透明性を継続的に重視しています。Googleのツールで生成されたすべての画像には、目に見えないSynthIDデジタル透かしが含まれています。ユーザーはGeminiアプリケーションに画像をアップロードし、SynthID認証を介してGoogle AIによって生成されたかどうかを直接確認できるようになりました。将来的には音声と動画のサポートも予定されています。SynthIDに加え、無料プランおよびGoogle AI Proユーザーが作成した画像には、より明確な識別を可能にするため、目に見えるGemini透かしが表示されます。プロフェッショナルワークフローにおいて、明瞭なビジュアルが求められる場合、Google AI Ultraサブスクリプションメンバーが作成した画像とGoogle AI Studio開発環境で生成された画像からは、目に見える透かしが削除されます。 

0

免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。

PoolX: 資産をロックして新しいトークンをゲット
最大12%のAPR!エアドロップを継続的に獲得しましょう!
今すぐロック

こちらもいかがですか?

ChainlinkがInjectiveの推奨Oracleソリューションに

簡単に言えば InjectiveはChainlinkを統合してリアルタイムの市場データとインフラスタックを提供し、より高速な DeFi 開発、トークン化された金融商品、オンチェーン アプリへのアクセスの拡大などです。

MPOST2025/11/21 23:33
ChainlinkがInjectiveの推奨Oracleソリューションに

OpenAI 拡充 ChatGPT グループチャット機能により、最大20人のユーザーが同時にやり取り可能

簡単に言えば OpenAI グループチャット機能をすべてのサブスクリプションレベルで展開し、最大20人のユーザーが同時に共同作業できるようになりました。 ChatGPT 同じスレッドで。

MPOST2025/11/21 23:33
OpenAI 拡充 ChatGPT グループチャット機能により、最大20人のユーザーが同時にやり取り可能

Cysic社、NOYA向けに高速かつコスト効率の高いZKプルーフを提供

簡単に言えば Cysicは、AI搭載のゼロ知識証明生成を可能にするフルスタックコンピューティングネットワークを提供しています。 Web3 大規模でリアルタイムの分散型ワークロードをサポートするアプリケーション。

MPOST2025/11/21 23:33
Cysic社、NOYA向けに高速かつコスト効率の高いZKプルーフを提供