Googleが次世代画像生成AI「NanoBananaPro」発表!美麗画像と”正確な情報”を両立
Googleは、革新的な画像生成・編集モデル「NanoBananaPro(Gemini3ProImage)」を公式に発表しました。
この新しいAIモデルは、Googleが誇る最先端の推論技術と現実世界の膨大な知識を融合させ、これまでになかった「情報視覚化」の実現を目指します。
Gemini3Proベースの”賢い”画像生成AI
「NanoBananaPro」は、先日リリースされたばかりの推論機能が大幅に強化された「Gemini3Pro」を基盤としています。
単に美しい画像を生成するだけでなく、与えられたコンテンツや「現実世界の事実」に基づき、見る人が深く理解できるような文脈豊かなインフォグラフィックや図表、そして「正確な」解説を作成する能力を備えています。
画像内に自然なテキストを自在に生成
このAIの特筆すべき機能の一つが、生成する画像内にテキストを直接、正確にレンダリングできる点です。
短いキャッチフレーズから長文の段落まで、様々なスタイル、フォント、そして多言語に対応し、テキストを自然に埋め込むことが可能です。
Googleが公開したサンプルでは、単語の意味を視覚的に表現するカリグラフィーや、商品名をイメージを損なわずに多言語へ正確に翻訳する事例などが紹介されており、その表現力の高さがうかがえます。
複雑なビジュアルも思いのままに
「NanoBananaPro」は、最大14枚の画像を組み合わせ、最大5人の人物の一貫性と類似性を維持しながら、複雑な要素をブレンドした画像を生成する能力も持ち合わせています。
これにより、ラフスケッチをリアルな製品イメージに変換したり、設計図をフォトリアリスティックな3D構造物にしたりといった、コンセプト段階から制作への橋渡しを劇的に簡素化します。
リアルタイム情報を画像に統合
さらに、ウェブ検索機能を活用して最新情報を画像内に取り込むことが可能です。
例えば、料理のレシピを画像に直接掲載したり、最新の天気予報をビジュアルコンテンツとして表示させたりと、動的で実用的な画像生成が実現します。
プロ級の画像調整機能で究極の表現を
生成された画像を細かく調整する機能も充実しています。
カメラアングル、シーン照明、被写界深度、フォーカス、カラーグレーディングといった、プロのカメラマンやデザイナーが使うような詳細なパラメーターを操作し、ユーザーが求める理想の画像を追求できます。
高解像度化とコスト:進化の代償
前バージョンの「NanoBanana(Gemini2.5FlashImage)」が1024x1024pxという解像度だったのに対し、「NanoBananaPro」では2Kまたは4Kの高解像度での画像生成が可能となりました。
ただし、その分、生成にかかる時間は若干増加し、コストも旧バージョン(1枚あたり0.039ドル)と比較して、2K画像で1枚あたり0.139ドル、4K画像で1枚あたり0.24ドルに上昇しています。
これは、より高品質な画像を得るための「進化の代償」と言えるでしょう。
利用方法とプラン別の制限
「NanoBananaPro」は、すでにGoogleの既存のAIツールの多くに導入されており、「Geminiアプリ」での画像生成は、この新モデルがデフォルトで適用されます。
ただし、無料サブスクリプションプランのユーザーには生成枚数に制限があり、それを超えると従来の「NanoBanana」による生成に切り替わります。
有料プランの「GoogleAIPlus」「Pro」「Ultra」ユーザーも枚数制限の対象ですが、具体的な枚数は公表されていません。
開発者向けには、「GeminiAPI」「GoogleAIStudio」、そして新しい統合開発環境「Antigravity」を通じて利用可能です。
また、無料および「GoogleAIPro」プランで生成された画像には、視認可能なGeminiロゴの透かしが表示されます。
一方、業務利用を想定した「GoogleAIUltra」プラン以上のユーザー、および「GoogleAIStudio」で生成された画像には、この透かしは入りません。
「NanoBananaPro」の登場は、画像生成AIの新たな可能性を切り開き、私たちのクリエイティブな表現や情報伝達の方法に大きな変革をもたらすことでしょう。
コメント一覧
まだコメントはありません。
← トップに戻る