【AI早读 0614】美国政府紧急封禁 Anthropic 最强模型

AI 早读 0614 封面

美国政府援引国安令，紧急封禁 Fable 5 和 Mythos 5

6 月 12 日下午，Anthropic 收到美国政府出口管制指令，要求立即暂停所有外国国民对 Fable 5 和 Mythos 5 的访问权限 - 包括 Anthropic 内部的外国籍员工。指令援引国家安全权力，未给出具体细节。Anthropic 随后对全球用户关闭了这两个最强模型。

Anthropic 在声明中表示不认同这项指令。政府声称发现了一种绕过 Fable 5 安全防护的“越狱”方法，但 Anthropic 评估后认为，这个所谓的越狱手段只能发现少量已知的轻微漏洞，且其他公开模型无需绕过就能发现同样的问题。声明还指出，Fable 5 在发布前通过了数千小时的红队测试，其安全防护是迄今已部署模型中最强的，没有任何测试者找到过通用越狱方法。

WSJ 和 TechCrunch 的后续报道揭示了一个关键背景：Amazon CEO Andy Jassy 向财长 Scott Bessent 等政府官员汇报，称 Amazon 的研究人员用 Claude Fable 5 获取了可用于网络攻击的信息。这可能是触发出口管制的直接原因。Amazon 回应称“政府经常就潜在安全风险征求我们的意见”，但否认主动要求封禁。

链接：Statement on the US government directive to suspend access to Fable 5 and Mythos 5

链接：Amazon CEO reportedly raised Anthropic model concerns before government crackdown

Simon Willison 记录了切断过程：他编写脚本轮询 API，发现自己的 Fable 5 权限在 6 月 12 日美西时间 6:59pm 正式切断，API 返回 404，提示“Claude Fable 5 is not available”。

链接：Statement on the US government directive to suspend access to Fable 5 and Mythos 5

Anthropic 在声明末尾警告，如果这个标准被应用到全行业，实际上将停止所有前沿模型的新部署。

Microsoft SkillOpt：用 Markdown 文件当模型权重来训练

Microsoft 联合三所中国高校发表了一篇名为 SkillOpt 的研究，展示了一种极简的模型优化思路：把一份 Markdown 格式的指令文档（他们称为“skill”）当作模型参数一样去迭代优化，最终让 GPT-5.5 在程序化任务上提升了超过 20 个百分点。

链接：Microsoft's SkillOpt boosts GPT-5.5 by using nothing but a trained Markdown file

Skill 这个概念不新鲜 - Anthropic 去年就给 Claude 加了模块化 skill 系统，会自动加载特定任务的指令、脚本和资源。但 SkillOpt 的关键区别在于，它不再靠手工或单次生成来写 skill，而是引入了一个独立的语言模型作为优化器，记录 agent 运行日志后识别错误和成功模式，然后对 skill 做编辑增删。每次修改只有通过验证集的性能检验才会被保留。

作者把深度学习概念映射到了文本层面：每步限制可编辑的段落数量作为学习率，调度器按 epoch 缩小步长，被拒绝的编辑进入缓存作为负面样本，epoch 末的慢更新保留稳定的编辑方向 - 和梯度平滑如出一辙。一个参数不调，只调 prompt。

KPMG 因幻觉撤回自己的 AI 报告

咨询巨头 KPMG 撤回了 2025 年 10 月发布的报告《Redefining Excellence in the Age of Agentic AI》，原因是多家被调研机构声称报告中关于它们的 AI 使用情况不实。GPTZero 研究团队指出，不准确信息来源于 AI 幻觉，且 KPMG 很可能用 AI 辅助撰写了一份关于 AI 的行业报告。

链接：KPMG pulls report on AI usage due to apparent hallucinations

UBS、英国 NHS、瑞士联邦铁路和伦敦交通局均向 FT 表示报告中的声明不实或误导。KPMG 发言人回应称已启动内部调查，强调“要求所有员工遵循负责任使用 AI 的准则，包括人工审查内容和验证独立来源”。上个月 EY 也因报告包含虚假脚注而撤回了一份关于忠诚度计划的报告 - 四大咨询机构在 AI 议题上的信任危机正在蔓延。

GLM 5.2 发布，下周开源权重

智谱 AI 发布了 GLM 5.2，并在社交平台表示下周将开放 MIT 许可证的权重。在社区测试中，GLM 5.2 的表现存在分歧：Reddit 上有用户认为其在 Pac-Man 测试中表现不错，也有用户对 5.2 Air 版本的成绩表示疑虑，认为可能还有 Flash 版本会在后续放出。

GLM 5.2 Is Out

Kimi K2.7 Code 以 12 倍价格优势对标 GPT-5.5 和 Claude

Moonshot 开源了 Kimi K2.7 Code，定位是性价比极高的代码模型。The Decoder 报道称其每 token 成本比 GPT-5.5 和 Claude 低最多 12 倍，Unsloth 已经发布了 GGUF 量化版本供本地运行。

链接：Moonshot's open model Kimi K2.7 Code undercuts GPT-5.5 and Claude by up to 12x on price per token

OpenAI WebRTC 语音会话支持文档上下文

Simon Willison 更新了 openai-webrtc 浏览器工具，新增对 GPT-Realtime-2 模型的支持 - OpenAI 称其为“首个具备 GPT-5 级别推理能力的语音模型”。新版本允许用户在浏览器中粘贴大量文档内容，然后通过语音与模型讨论这些信息，把语音交互从简单的对话扩展到了文档分析场景。

链接：OpenAI WebRTC Audio Session, now with document context

其他值得关注的动态

Google DeepMind 的语言模型可解释性团队在 AI Alignment Forum 发表研究，发现 Gemini 的安全相关属性主要来自 SFT（监督微调），而非 RL 或其他阶段 - SFT-only 模型和生产版本在所有安全基准上高度重合，包括对齐评估、过度拒绝率和不安全响应率。

Google Research 的 Gemini-SQL2 在 text-to-SQL 基准测试中大幅领先。Claude Fable 5 在被封禁前刚被报道在 FrontierMath 最难问题上超过 GPT-5.5 达 13 个百分点。OpenAI 也面临来自美国各州总检察长的调查。微软 CEO Satya Nadella 在采访中承认自己也是个“token maxer”，表示“这东西上瘾”。

来源：VerySmallWoods Research Feed - 2026-06-14 UTC

【AI早读 0614】美国政府紧急封禁 Anthropic 最强模型

美国政府援引国安令，紧急封禁 Fable 5 和 Mythos 5

Microsoft SkillOpt：用 Markdown 文件当模型权重来训练

KPMG 因幻觉撤回自己的 AI 报告

GLM 5.2 发布，下周开源权重

Kimi K2.7 Code 以 12 倍价格优势对标 GPT-5.5 和 Claude

OpenAI WebRTC 语音会话支持文档上下文

其他值得关注的动态

相关文章

【AI早读0619】GLM-5.2登顶开源，智能体安全框架密集发布

【AI早读 0531】Anthropic 把 Claude「关在笼子里」的安全设计

【AI早读 0530】AI安全评估与Agent技能蒸馏

【AI早读 0620】AI Agent 重塑软件生命周期

来信

准备开始了吗？