返回博客2026年5月6日2 分钟阅读

GPT-5.5 Instant 发布解读:更准、更短、悄悄跨过的一条红线

摘要

OpenAI 把 ChatGPT 的默认模型从 GPT-5.3 Instant 升到了 GPT-5.5 Instant。发布页那篇博客只讲了三件事 - 幻觉减半、回答更短、记忆更聪明;但如果再翻一下官方的 System Card,会发现还有第四件 - 这是 OpenAI 第一次让默认 Instant 模型跨过 High capability 门槛。

昨天 OpenAI 把 GPT-5.5 Instant 上线了,并且直接设成了所有 ChatGPT 用户的默认模型。

发布博客那篇 - "smarter, clearer, and more personalized" - 大致是你能想到的那种文案:幻觉更少、回答更精炼、记忆能力更强。这些都对。但如果只看那一篇,会错过这次发布里更有意思的一件事。

我把发布博客和官方 System Card 都过了一遍。下面聊聊几条对开发者真正有意义的。

先说结论

  • 被替换掉的不是 GPT-5.4,是 GPT-5.3。Instant 这条产品线上跳过了 5.4,5.4 只有 Thinking 版本。
  • API 模型 ID 是 chat-latest。GPT-5.3 Instant 还保留 3 个月再下架。
  • 幻觉在高风险领域降了 52.5%,回答词数少了 30%,记忆带可视化来源了。
  • 真正值得知道的:这是第一个被 OpenAI 自己分类为 High capability 的 Instant 模型 - 在 Cybersecurity 和 Biological & Chemical Preparedness 两项上都跨过门槛。
  • 官方 System Card 里有几项 disallowed-content 的安全分确实回退了。这种程度的公开承认在大模型发布里很少见。

发布博客主推的三件事 - 准、短、个性化 - 都是真的,但深浅不一样。

幻觉这条改进最实在。OpenAI 在三类提示上做了对照:高风险领域(医疗 / 法律 / 金融)、用户标记的历史失败问、含事实密度的对话。三类全面提升 - 高风险那一类幻觉率降了 52.5%,用户标记类降了 37.3%。如果你的产品在用 GPT-5.3 Instant 做任何涉及具体事实的场景 - 客服、问答、知识助手 - 换上去基本就能拿到这个改进。

回答更短是个产品决策。官方原话:"30.2% fewer words and 29.2% fewer lines"。OpenAI 在主动让默认模型说话变短:少废话、少结尾问“还有什么我能帮你?”、少格式化堆砌。对 ChatGPT 体验是好事,对 API 用户更是好事 - 输出 token 是要花钱的。

个性化部分是 UX 上一个不大但挺重要的改动。每次回答下面会显示一行小标记,告诉你这个回答用到了哪些来源(哪段历史聊天、哪个文件、Gmail 里的哪封信)。用户可以删掉、修正这些“记忆”条目。之前 ChatGPT 的“记忆”是个黑盒,现在打开了,至少能看到它为什么会这么回答你。

真正的故事

这件事没在发布博客里被强调,但翻 System Card 第一段就能看到:

"GPT-5.5 Instant is the first Instant model to be considered High capability in the Cybersecurity and Biological & Chemical Preparedness categories."

意思是 OpenAI 第一次把一个 Instant 线上的模型,分到了它内部 Preparedness 框架里的 High 这一档。

OpenAI 的 Preparedness Framework 给模型在几个高风险领域 - Cybersecurity、Biological & Chemical、AI Self-Improvement 等 - 各自设了一个 capability 档位。Low / Medium / High / Critical 四档。一旦跨到 High,需要部署专门的安全缓解措施才能上线。

之前 Instant 这条产品线一直停留在更低的档位。只有 Thinking 系列(5.x Thinking、o1、o3 那一脉)会摸到 High。

这次 GPT-5.5 Instant 第一次在 Cybersecurity 和 Bio/Chem 上都摸到了 High。具体到数字:

  • Cybersecurity - 在 Cyber Range 评估上拿到 76.9% 通过率(13 个场景里失败 3 个)。OpenAI 的应对是默认部署在低 reasoning effort 下,加上自动化监控和账户级管制。
  • Biological & Chemical - 启用了拒绝训练 + 对话监控。生物相关的合成 hard 数据保护率 0.481,化学相关 0.923

注意 0.481 这个数字 - 在 hard 难度的生物安全保护测试里,模型有差不多一半的样本没拦住。OpenAI 的判断是配上自动化监控和拒绝训练之后整体可控,所以照常上线。

对你日常用 ChatGPT 没什么直接影响。但放到行业层面,这是一条隐形红线被悄悄推过去了 - 大众用户从今往后,默认用上的就是 OpenAI 自己分类为“高风险能力”的模型。

罕见地承认了几个回退

System Card 里还有一个细节值得注意。在 disallowed content 的部分,OpenAI 公开报告了几项分数比 GPT-5.3 Instant 低的情况:

类别GPT-5.3 InstantGPT-5.5 Instant
Gore(血腥)0.8670.703
Sexual(色情)0.8570.806
Sexual/minors(涉未成年)0.8450.810
Hate(仇恨)0.9040.827

前两项被官方明确标注为 "statistically significant decline"。

Jailbreak 抵抗这块写得也很坦白:

"We are actively iterating on evaluation structure...regression from GPT-5.3-Instant [is] directional rather than definitive."

直译:跟 5.3 比是退步,但我们觉得这个退步现在还没到“确定性”这一步。

模型变得更聪明、更简洁、更愿意配合用户 - 这些目标和“严格拦住所有 disallowed content”之间天然是有张力的。OpenAI 把这些数字公开放出来,本身是件好事。但开发者如果在做面向公众的应用,特别是给 minors 用的产品,需要自己再加一层 moderation - 不能只指望模型本身。

落地几条

API 这边,模型 ID 用 chat-latest。GPT-5.3 Instant 还会保留 3 个月,不用立刻迁移,但新功能从这边走更顺畅。输出 token 数下降会反映到账单上,是免费红利。如果你之前给 GPT-5.3 Instant 写过很复杂的 system prompt 逼它说话简短,可以试试简化掉一部分 - 5.5 自己就更短了。

做面向用户的产品时,涉及医疗 / 法律 / 金融建议类的应用,幻觉下降 52.5% 是真的能感受到的。但这不等于“现在可以放心给医疗建议” - 绝对错误率仍然不低。涉及内容安全的应用,特别是有 minors 用户的,自己再加一层 moderation - disallowed content 的回退是真的。“记忆 sources”这种把上下文来源摊开给用户看的做法,对 RAG / context 注入类产品也是个借鉴:用户对模型为什么这么回答有可见性,信任度会显著上升。

如果你做的是 Coding Agent 或者长链路任务,5.5 Instant 不是给你的。Instant 是 Instant 线,不是 Thinking 线。复杂的代码任务、agent 任务,仍然应该走 GPT-5.5 Thinking 或者 Claude Opus 4.7 这一档。Instant 的甜蜜点是“对话密度高、单步任务”。

放在更大的画面里看,这次发布有意思的地方在于 OpenAI 同时做了两个不那么明显的产品判断。一个是把默认模型推到了 High capability 那一档 - 这件事过去专属于 Thinking 线,现在普及到了 Instant,OpenAI 内部对“Instant 线 = 较低风险”这个隐含设定已经不再坚持。另一个是公开承认 disallowed content 上的几项回退,这是大模型发布里少见的透明 - 大多数发布只放赢的数字。

两件事合起来看,其实是 OpenAI 把过去藏在 Thinking 后面的某种风险曲线,搬到了所有人都能用到的位置。而且没有藏。值得记一笔。

参考链接:

相关文章

2026年6月12日

【AI早读0612】OpenAI收购Ona为Codex构建持久化Agent执行环境

今天的主线是 AI Agent 正在走向“生产级”:OpenAI 收购 Ona,给 Codex 补上持久化云端执行 —— 电脑离线后 Agent 仍能在企业自有云里接着跑。Google Cloud 用 TEE 推出 Confidential AI 保护推理数据;Anthropic 发布企业订阅 Claude Corps 并联合 DXC 进入受监管行业;AWS 开源 Agent-EvalKit 系统化评估 Agent 全执行链路;再加 DeepMind“模型察觉被评估反而表现更差”的研究与多 Agent 安全投资。

2026年6月9日

【AI早读 0609】OpenAI 连续发布金融行业 AI 实战案例

OpenAI 集中上线了一批 Ignite 大会演讲:方案工程师讲企业级 AI 落地框架 - 把 AI 当工作流里的一个可控节点而非独立智能层;GTM Lead 谈金融服务的特殊诉求,已从“帮我们分析数据”变成“嵌入实时交易决策链”;Erste Group、LSEG、Allica Bank 三家银行客户分享了平台层整合、数据协同和挑战者银行的差异化打法;另有两场从产品增长和人力杠杆角度切入 AI 的实践。

最近一封 · Sample

【AI早读 0613】智能体主动性飞跃与模型评估新范式

今天聚焦智能体的两个方向加一个底层动向:Simon Willison 记录 Claude Fable 5 的“relentlessly proactive” —— 为查一个滚动条 bug 自主注入代码、自写诊断 HTTP 服务、跨浏览器截图验证,是有意图的多步自纠探索;Google DeepMind 提出“模型 diffing”新范式,让审计智能体自主构造 prompt 主动搜索两个模型的行为差异;Google Cloud 发布 Open Knowledge Format,用带 YAML frontmatter 的 Markdown 为 AI 的结构化知识建开放标准。能力、评估、基础设施三条线正拼成智能体开发的完整图景。

—— william

Letters

来信

里面装的是

  • 新文章 — 写完一篇就寄一封,不攒货
  • 这周读到的、看到的、好用的工具
  • 正在折腾的实验,附带翻车记录

约莫 1–2 周一封 · 随时退订

合作伙伴

CompeteMap — 英国及爱尔兰学生竞赛一站式搜索

数学、编程、科学、写作等各类竞赛信息汇总,支持按年龄和科目筛选,再也不错过报名截止日。

准备开始了吗?

先简单说明目标,我会给出最合适的沟通方式。