
谷歌正在升级其图像生成模型,加入新的编辑技巧、更高的分辨率、更准确的文本渲染以及网页搜索功能。
这款名为Nano Banana Pro的新型号基于谷歌本周早些时候发布的最新大型语言模型Gemini 3。公司声称Nano Banana Pro在前代Nano Banana基础上有所改进,能够创建更详细的图像和更准确的文本,并生成不同风格、字体和语言的文本。

模型还具备网页搜索功能,比如让它查找食谱和生成抽认卡。
谷歌表示,Nano Banana Pro 旨在让专业人士对图像有更多控制权,允许用户控制摄像机角度、场景光照、景深、对焦和调色等方面。与Nano Banana的分辨率上限1024 x 1024px相比,用户可以用Nano Banana Pro生成2K或4K图像。
公司指出,虽然Nano Banana Pro可以生成更高质量的图像,但比原版1024px图片价格为0.039美元,速度更慢且成本更高。相比之下,新型号每张1080p或2K图片售价为0.139美元,每张4K图片售价为0.24美元。

新型号可使用六张高保真照片,或在一张图片中融合最多14个物体。它还能保持最多五个人的一致性和相似度。公司发布了演示应用,你可以试用这些功能。
Nano Banana Pro 正在谷歌众多现有的 AI 工具中推广。Gemini应用现在默认使用新模型生成图片,但免费订阅用户只能使用该模型生成有限数量的图片,之后将默认使用原始的Nano Banana模型。
Google AI Plus、Pro 和 Ultra 用户将获得更高的用户用户门槛,尽管公司未透露具体限制。这些订阅者也可以通过NotebookLM访问该模型。
谷歌还通过AI模式向美国的AI Pro和Ultra订阅用户提供该模型。Ultra订阅用户可以通过公司视频工具Flow访问该模型,Workspace用户也可在Google幻灯片和视频中访问。
开发者可以通过Gemini API、Google AI Studio以及公司新推出的IDE Antigravity来使用Nano Banana Pro。
公司还将SynthID技术——用于水印和检测AI生成图像的技术——整合进Gemini应用中。用户可以上传图片,聊天机器人会告诉他们该图片是否由公司的图片模型创建或修改。
谷歌表示,随着时间推移,它将支持C2PA内容凭证检测以实现内容验证。