返回博客2026年5月6日2 分钟阅读

GPT-5.5 Instant 发布解读:更准、更短、悄悄跨过的一条红线

摘要

OpenAI 把 ChatGPT 的默认模型从 GPT-5.3 Instant 升到了 GPT-5.5 Instant。发布页那篇博客只讲了三件事 - 幻觉减半、回答更短、记忆更聪明;但如果再翻一下官方的 System Card,会发现还有第四件 - 这是 OpenAI 第一次让默认 Instant 模型跨过 High capability 门槛。

昨天 OpenAI 把 GPT-5.5 Instant 上线了,并且直接设成了所有 ChatGPT 用户的默认模型。

发布博客那篇 - "smarter, clearer, and more personalized" - 大致是你能想到的那种文案:幻觉更少、回答更精炼、记忆能力更强。这些都对。但如果只看那一篇,会错过这次发布里更有意思的一件事。

我把发布博客和官方 System Card 都过了一遍。下面聊聊几条对开发者真正有意义的。

先说结论

  • 被替换掉的不是 GPT-5.4,是 GPT-5.3。Instant 这条产品线上跳过了 5.4,5.4 只有 Thinking 版本。
  • API 模型 ID 是 chat-latest。GPT-5.3 Instant 还保留 3 个月再下架。
  • 幻觉在高风险领域降了 52.5%,回答词数少了 30%,记忆带可视化来源了。
  • 真正值得知道的:这是第一个被 OpenAI 自己分类为 High capability 的 Instant 模型 - 在 Cybersecurity 和 Biological & Chemical Preparedness 两项上都跨过门槛。
  • 官方 System Card 里有几项 disallowed-content 的安全分确实回退了。这种程度的公开承认在大模型发布里很少见。

发布博客主推的三件事 - 准、短、个性化 - 都是真的,但深浅不一样。

幻觉这条改进最实在。OpenAI 在三类提示上做了对照:高风险领域(医疗 / 法律 / 金融)、用户标记的历史失败问、含事实密度的对话。三类全面提升 - 高风险那一类幻觉率降了 52.5%,用户标记类降了 37.3%。如果你的产品在用 GPT-5.3 Instant 做任何涉及具体事实的场景 - 客服、问答、知识助手 - 换上去基本就能拿到这个改进。

回答更短是个产品决策。官方原话:"30.2% fewer words and 29.2% fewer lines"。OpenAI 在主动让默认模型说话变短:少废话、少结尾问“还有什么我能帮你?”、少格式化堆砌。对 ChatGPT 体验是好事,对 API 用户更是好事 - 输出 token 是要花钱的。

个性化部分是 UX 上一个不大但挺重要的改动。每次回答下面会显示一行小标记,告诉你这个回答用到了哪些来源(哪段历史聊天、哪个文件、Gmail 里的哪封信)。用户可以删掉、修正这些“记忆”条目。之前 ChatGPT 的“记忆”是个黑盒,现在打开了,至少能看到它为什么会这么回答你。

真正的故事

这件事没在发布博客里被强调,但翻 System Card 第一段就能看到:

"GPT-5.5 Instant is the first Instant model to be considered High capability in the Cybersecurity and Biological & Chemical Preparedness categories."

意思是 OpenAI 第一次把一个 Instant 线上的模型,分到了它内部 Preparedness 框架里的 High 这一档。

OpenAI 的 Preparedness Framework 给模型在几个高风险领域 - Cybersecurity、Biological & Chemical、AI Self-Improvement 等 - 各自设了一个 capability 档位。Low / Medium / High / Critical 四档。一旦跨到 High,需要部署专门的安全缓解措施才能上线。

之前 Instant 这条产品线一直停留在更低的档位。只有 Thinking 系列(5.x Thinking、o1、o3 那一脉)会摸到 High。

这次 GPT-5.5 Instant 第一次在 Cybersecurity 和 Bio/Chem 上都摸到了 High。具体到数字:

  • Cybersecurity - 在 Cyber Range 评估上拿到 76.9% 通过率(13 个场景里失败 3 个)。OpenAI 的应对是默认部署在低 reasoning effort 下,加上自动化监控和账户级管制。
  • Biological & Chemical - 启用了拒绝训练 + 对话监控。生物相关的合成 hard 数据保护率 0.481,化学相关 0.923

注意 0.481 这个数字 - 在 hard 难度的生物安全保护测试里,模型有差不多一半的样本没拦住。OpenAI 的判断是配上自动化监控和拒绝训练之后整体可控,所以照常上线。

对你日常用 ChatGPT 没什么直接影响。但放到行业层面,这是一条隐形红线被悄悄推过去了 - 大众用户从今往后,默认用上的就是 OpenAI 自己分类为“高风险能力”的模型。

罕见地承认了几个回退

System Card 里还有一个细节值得注意。在 disallowed content 的部分,OpenAI 公开报告了几项分数比 GPT-5.3 Instant 低的情况:

类别GPT-5.3 InstantGPT-5.5 Instant
Gore(血腥)0.8670.703
Sexual(色情)0.8570.806
Sexual/minors(涉未成年)0.8450.810
Hate(仇恨)0.9040.827

前两项被官方明确标注为 "statistically significant decline"。

Jailbreak 抵抗这块写得也很坦白:

"We are actively iterating on evaluation structure...regression from GPT-5.3-Instant [is] directional rather than definitive."

直译:跟 5.3 比是退步,但我们觉得这个退步现在还没到“确定性”这一步。

模型变得更聪明、更简洁、更愿意配合用户 - 这些目标和“严格拦住所有 disallowed content”之间天然是有张力的。OpenAI 把这些数字公开放出来,本身是件好事。但开发者如果在做面向公众的应用,特别是给 minors 用的产品,需要自己再加一层 moderation - 不能只指望模型本身。

落地几条

API 这边,模型 ID 用 chat-latest。GPT-5.3 Instant 还会保留 3 个月,不用立刻迁移,但新功能从这边走更顺畅。输出 token 数下降会反映到账单上,是免费红利。如果你之前给 GPT-5.3 Instant 写过很复杂的 system prompt 逼它说话简短,可以试试简化掉一部分 - 5.5 自己就更短了。

做面向用户的产品时,涉及医疗 / 法律 / 金融建议类的应用,幻觉下降 52.5% 是真的能感受到的。但这不等于“现在可以放心给医疗建议” - 绝对错误率仍然不低。涉及内容安全的应用,特别是有 minors 用户的,自己再加一层 moderation - disallowed content 的回退是真的。“记忆 sources”这种把上下文来源摊开给用户看的做法,对 RAG / context 注入类产品也是个借鉴:用户对模型为什么这么回答有可见性,信任度会显著上升。

如果你做的是 Coding Agent 或者长链路任务,5.5 Instant 不是给你的。Instant 是 Instant 线,不是 Thinking 线。复杂的代码任务、agent 任务,仍然应该走 GPT-5.5 Thinking 或者 Claude Opus 4.7 这一档。Instant 的甜蜜点是“对话密度高、单步任务”。

放在更大的画面里看,这次发布有意思的地方在于 OpenAI 同时做了两个不那么明显的产品判断。一个是把默认模型推到了 High capability 那一档 - 这件事过去专属于 Thinking 线,现在普及到了 Instant,OpenAI 内部对“Instant 线 = 较低风险”这个隐含设定已经不再坚持。另一个是公开承认 disallowed content 上的几项回退,这是大模型发布里少见的透明 - 大多数发布只放赢的数字。

两件事合起来看,其实是 OpenAI 把过去藏在 Thinking 后面的某种风险曲线,搬到了所有人都能用到的位置。而且没有藏。值得记一笔。

参考链接:

相关文章

合作伙伴

CompeteMap — 英国及爱尔兰学生竞赛一站式搜索

数学、编程、科学、写作等各类竞赛信息汇总,支持按年龄和科目筛选,再也不错过报名截止日。

准备开始了吗?

先简单说明目标,我会给出最合适的沟通方式。