Nano Banana 2:Pro 级图片生成,Flash 级速度,还便宜了 40%
Google 今天发布了 Nano Banana 2,技术代号 Gemini 3.1 Flash Image。一句话总结:把 Nano Banana Pro 的图片质量塞进了 Flash 模型的速度和成本里。
这不是一个渐进式升级。上一代 Flash 图片模型和 Pro 之间有明显的质量鸿沟,而 Nano Banana 2 基本抹平了这个差距 - 至少在大多数日常场景下。
为什么值得关注
AI 图片生成工具很多,但真正能用在生产环境里的,卡在两个问题上:要么质量够但太贵太慢,要么快但质量不够看。Nano Banana 2 的定位就是解决这个矛盾。
几个关键数字:
- 分辨率:512px 到 4K,原生支持各种宽高比(包括极端的 8:1 和 1:8)
- 成本:比 Pro 便宜 25%-50%,4K 分辨率下 $0.151 vs Pro 的 $0.240
- 速度:Flash 级别,适合需要快速迭代的场景
| 分辨率 | Nano Banana 2 | Pro | 节省 |
|---|---|---|---|
| 1K | $0.067 | $0.134 | ~50% |
| 2K | $0.101 | $0.134 | ~25% |
| 4K | $0.151 | $0.240 | ~37% |
几个实用的能力
文字渲染 - 以前 AI 生图最头疼的就是文字,不是拼写错就是字形歪。Nano Banana 2 在这方面有明显进步,能准确渲染文字,甚至支持跨语言翻译。Google 的官方 demo 里展示了一张"Native Wildlife"标牌自动翻译成印地语和德语的例子 - 不只是翻译文字,整张图片的排版风格都跟着调整了。做营销海报、贺卡这类需要精确文字的场景终于可以用了。
角色一致性 - 单个工作流里最多保持 5 个角色的外貌一致性,14 个物体的保真度。官方展示了一个 14 个角色的农场场景,以及一组 6 面板的连续故事 - 一个小女孩带着狗在秋天撑伞的叙事,每一帧里角色的外貌都保持一致。这对故事板、连续插画、产品系列图来说很实用 - 以前要做到这点得靠大量 prompt 工程和运气。
实时 Web 搜索 - 生成图片时可以拉取实时信息和参考图片。Google 做了一个叫 Window Seat 的 demo 应用,它根据真实地点和实时天气数据生成逼真的窗外风景。还有一个 Pet Passport demo - 上传你家宠物的照片,它能生成宠物在全球各地标前的冒险图,保持宠物外貌一致。这对旅游应用、本地化营销特别有用。
数据可视化 - 能从笔记直接生成信息图、图表、流程图。官方页面展示了地球内部结构剖面图、云的类型对比图、水循环示意图、蜂蜜生产 4 阶段信息图等例子。不是替代专业图表工具,但对快速出一张示意图来说够用了。
开发者怎么用
Nano Banana 2 目前以预览版提供,API 模型名是 gemini-3.1-flash-image-preview,可以通过以下方式接入:
- Gemini API / Gemini CLI - 最直接的方式
- Vertex AI - 企业级部署
- AI Studio - 在线快速实验
如果你已经在用 Gemini API 做图片生成,切换到 Nano Banana 2 基本就是换个模型名的事。
哪些场景适合
结合官方 demo 和能力特点,这几个方向最值得尝试:
- 电商产品图 - 多角度、多场景的产品展示,物体一致性保证视觉统一。官方的 Global Ad Localizer demo 展示了同一张广告自动适配不同市场语言的能力
- 内容营销 - 社交媒体配图、博客插画,支持各种宽高比,竖版横版都行。生日卡、感谢卡这类带装饰性文字的场景现在也能直接生成了
- 故事板和原型 - 快速迭代视觉概念,512px 低分辨率模式延迟最低。6 面板连续叙事的 demo 说明它确实能做到跨帧角色一致
- 本地化素材 - 文字渲染 + 翻译能力,一套 prompt 生成多语言版本
- 教育内容 - 从文字描述生成示意图、信息图。官方展示的厨余蔬菜再生指南、面粉类型对比图、回收原理图都是很好的例子
Pro 还需要吗
Nano Banana Pro 没有下线。Google 的说法是 Pro 继续用于"需要最高保真度的高精度任务"。实际体验上,Nano Banana 2 在复杂场景下确实还有一点"AI 感" - Pro 的输出在动态感和真实感上仍然更好。
但对于 80% 的日常图片生成需求,Nano Banana 2 的质量已经够了,而速度和成本优势明显。这就像 GPT-4o-mini 之于 GPT-4o 的关系 - 大多数时候用小的就够,真正需要极致质量时再上大的。
可以去哪里用
除了 API,普通用户可以直接在这些地方体验:
- Gemini App - 已成为默认图片生成模型
- Google Search AI Mode - 搜索时直接生成图片
- Google Lens - 141+ 个国家新增支持
- Flow - Google 的创意工具,免费使用
Nano Banana 2 还集成了 SynthID 水印和 C2PA 内容认证,生成的图片带有可验证的 AI 生成标记。
对于一直在观望 AI 图片生成 API 的开发者来说,这可能是一个不错的入场时机 - 质量到位、价格合理、生态成熟。
相关文章
2026年1月25日
用 Agent Skills 把技术文章变成哆啦A梦风格漫画
使用 Claude Code 的 baoyu-comic 技能,将 Anthropic 的 Skills Explained 文章转换成 8 页教育漫画,featuring 哆啦A梦角色。
2026年2月25日
本站已支持 RSS 订阅
VerySmallWoods 博客现已提供 RSS Feed,支持所有主流 RSS 阅读器自动发现和订阅。
2026年2月24日
Cloudflare 工程主管的 Claude Code 工作流:先研究,再规划,最后才写代码
Boris Tane 分享了他使用 Claude Code 的核心原则:永远不要让 Claude 在你审批计划之前就开始写代码。这套研究-规划-标注-实现的工作流,值得每个用 AI 编程的人借鉴。