还没正式发布,就已经把所有人干沉默了。
2026 年 4 月初,AI 模型评测平台 LM Arena 上悄悄出现了三个匿名图像模型,没有任何预告,没有任何说明。用户们测完之后集体失语——生成质量远超当前最强的 GPT Image 1.5。几小时后,这三个模型就消失了。
社区炸锅之后,多方交叉印证指向同一个结论:这就是 GPT-Image-2,OpenAI 即将发布的下一代图像生成模型。如果你已经升级了 ChatGPT Plus 并体验过图片生成功能,这次 GPT-Image-2 的升级幅度可能会超出你的预期。
GPT-Image-2 是什么:OpenAI 下一代图像模型泄露始末
事情要从 LM Arena(lmarena.ai)说起。
4 月初,平台上突然冒出三个代号分别是 maskingtape-alpha、gaffertape-alpha 和 packingtape-alpha 的匿名模型。用户们照常测试,结果发现输出质量断层领先,远超目前所有公开模型。
几小时后,模型被撤下,就像从没出现过一样。
但社区不会放过任何线索。根据 API 元数据分析、用户端测试记录以及 ChatGPT 内部 A/B 测试的交叉比对,这批模型的真实身份基本坐实:GPT-Image-2,OpenAI 下一代图像生成模型。
这不是第一次了。2025 年 12 月,Arena 上出现过代号 "Chestnut" 和 "Hazelnut" 的匿名模型,几周后 OpenAI 正式发布了 GPT Image 1.5。历史正在重演。
有意思的是,这个泄露时间点和 Google 悄悄上线 NanoBanana2 图像模型 几乎前后脚。AI 图像生成的军备竞赛,已经白热化了。
GPT-Image-2 五大核心升级
GPT-Image-2 文字渲染:准确率从 95% 拉到 99%+
AI 画图最大的硬伤,终于被正面击穿了。
GPT Image 1.5 的文字准确率大约在 90-95%,已经算是当时的天花板。而 GPT-Image-2 的预期准确率直接拉到 99%+,并且支持中文、日文、阿拉伯文等非拉丁文字体系。
多词标签、按钮文字、菜单标题、混合大小写——全部稳定渲染,不再乱码。这一点和 NanoBanana2 在文字渲染上的改进方向一致,但 GPT-Image-2 的精度明显更高。
UI 界面截图生成:以假乱真
这是让所有人最震惊的能力。
GPT-Image-2 可以生成看起来像真实软件界面的图片——浏览器窗口、App 截图、数据看板、支付页面。不是"差不多像",是真的像,像到需要仔细看才能分辨真假。
这个能力意味着什么?产品经理出原型图、设计师做概念稿、自媒体做配图——以前需要截真图或者用 Figma 画的活,现在一句话 Prompt 就能搞定。
全新独立架构:不再是 GPT-4o 的衍生品
GPT Image 1 系列本质上是 GPT-4o 的自回归图像能力,图像生成只是语言模型的"副产品"。而 GPT-Image-2 采用了全新的独立架构,这是 OpenAI 图像生成的第三次底层架构变革。
独立架构意味着什么?模型可以专注于图像生成任务,不再受语言模型训练目标的牵制。简单说,以前是"顺便画个图",现在是"专门画图"。
GPT-Image-2 原生 4K 分辨率输出
预期支持 2048x2048 甚至 4096x4096 的原生输出,告别放大糊图。
之前用 GPT Image 1 系列生成的图片,分辨率一直是短板,很多场景下还得二次放大才能用。GPT-Image-2 直接原生 4K 输出,省去了后处理的麻烦。对比 NanoBanana2 默认 2K 输出,GPT-Image-2 在分辨率上直接翻倍。
色彩还原更自然:告别黄色偏色
GPT Image 1.5 一直有个让人头疼的小问题——生成的图片普遍带有轻微的黄色偏色,拿来做产品图或者 UI 截图的时候,色差很明显。
GPT-Image-2 修复了这一点,色彩渲染更中性、更自然,无需后期处理。这对商业用途来说是个重要改进。
GPT-Image-2 实测案例:这些图全是 AI 生成的
下面这些案例来自社区用户的实际测试。看完你就明白,为什么说 GPT-Image-2 让 ChatGPT 图片生成进入了新阶段。
飞书多维表格截图
GPT-Image-2 生成的飞书多维表格截图
表格列头文字清晰,状态标签颜色区分准确,中文字段名称零乱码,整体布局与真实飞书界面高度一致。有人把这张图发到工作群里,同事第一反应是"你截图干嘛"。
GPT-Image-2 生成的飞书数据看板
抖音直播间截图
Prompt 是这样写的:生成一张抖音直播间的手机截图,主播正在直播,右下角有礼物特效,评论区有弹幕,显示在线人数 12.3万。
下面两张图,全部由 AI 生成:
GPT-Image-2 生成的抖音直播间截图效果
GPT-Image-2 生成的抖音直播间界面细节
弹幕文字可读,在线人数数字准确,UI 元素位置与真实抖音直播界面几乎一致。GPT-Image-2 的文字渲染能力在这个案例里体现得淋漓尽致——没有任何变形或乱码。
支付宝付款截图
Prompt:生成一张支付宝付款成功的截图。
GPT-Image-2 生成的支付宝付款成功截图
金额数字清晰准确,"支付宝"品牌字样正常渲染,整体视觉风格与真实支付宝界面高度吻合。逼真到有人拿来开玩笑——
GPT-Image-2 支付宝截图以假乱真的对话场景
需要提醒的是:AI 生成的支付截图仅供技术测试和娱乐。请勿用于任何欺诈用途,这不仅违法,而且很容易被专业人员识别。
产品信息图
Prompt:生成一张产品信息图。
GPT-Image-2 生成的产品信息图效果
排版规范,信息层级清晰,字体样式自然。设计师看完可能要重新评估一下自己做信息图的效率了。
GPT-Image-2 上线后 Plus/Pro 用户优先体验,支付宝微信即可充值
GPT-Image-2 怎么体验
GPT-Image-2 目前还没正式发布,但有两种方式可以提前碰到它。
方式一:Chatbot Arena 随机匹配
打开 lmarena.ai,进入 Battle 模式(图像生成对战),多次刷新匹配。系统会匿名分配模型,有一定概率碰上代号为 duct-tape-2 的新模型。
纯看运气,但碰上了你就知道——输出质量和其他模型完全不在一个档次。
方式二:ChatGPT 图片生成中随机触发
大量用户在 X 上反馈,当在 ChatGPT 中使用图片生成功能时,尤其是生成包含大量文字、UI 界面或产品图的复杂图像,系统会随机切换到新版模型(duct-tape-2),输出质量明显高于 GPT Image 1。
这个完全靠 OpenAI 的 A/B 测试分配,无法主动选择。但如果你是 ChatGPT Plus 或 Pro 用户,被分配到新模型的概率会更高。
还没有 ChatGPT Plus?可以参考 ChatGPT Plus 国内充值教程,支持支付宝和微信支付,几分钟就能完成升级。GPT-Image-2 正式上线后,Plus/Pro 用户一定是第一批能用上的。
GPT-Image-2 对 ChatGPT 图片生成意味着什么
从 DALL-E 到 GPT Image 1,再到即将到来的 GPT-Image-2,OpenAI 的图像能力每一代都在颠覆上一代的认知。
而这次,文字渲染、UI 截图、4K 分辨率三个方向同时突破,意味着 ChatGPT 图片生成正式进入"生产可用"阶段——不再是"差不多能用",而是真的能直接用。
对于设计师、产品经理、自媒体运营、电商从业者来说,GPT-Image-2 可能会重新定义"做图"这件事的效率天花板。
我的建议很简单:如果你还没有 ChatGPT Plus,现在是入手的好时机。GPT-Image-2 正式上线后,图片生成额度大概率会和 Plus/Pro 订阅挂钩。早一步准备好,就能早一步用上最新功能。
相关推荐
如果你对 AI 图像生成或 ChatGPT 最新功能感兴趣,以下内容可能对你有帮助:
- ChatGPT Plus 充值:2026 年最新 ChatGPT Plus 国内充值教程 — 支持支付宝/微信,国内用户首选
- ChatGPT 代充安全:ChatGPT 代充安全吗?避坑指南 — 识别靠谱渠道与封号风险
- AI 工具盘点:2025 年最好的 AI 工具推荐 — 覆盖编程、写作、设计等多个领域
- NanoBanana2 评测:Gemini NanoBanana2 使用体验 — Google 图像模型横向对比