【AI早读 0614】美国政府紧急封禁 Anthropic 最强模型
摘要
美国政府援引国家安全权力,要求 Anthropic 暂停外国国民访问 Fable 5 与 Mythos 5;与此同时,Microsoft SkillOpt 展示如何像训练模型权重一样迭代优化 Markdown skill,GLM-5.2 等新进展也在继续推动模型能力边界。

美国政府援引国安令,紧急封禁 Fable 5 和 Mythos 5
6 月 12 日下午,Anthropic 收到美国政府出口管制指令,要求立即暂停所有外国国民对 Fable 5 和 Mythos 5 的访问权限 - 包括 Anthropic 内部的外国籍员工。指令援引国家安全权力,未给出具体细节。Anthropic 随后对全球用户关闭了这两个最强模型。
Anthropic 在声明中表示不认同这项指令。政府声称发现了一种绕过 Fable 5 安全防护的“越狱”方法,但 Anthropic 评估后认为,这个所谓的越狱手段只能发现少量已知的轻微漏洞,且其他公开模型无需绕过就能发现同样的问题。声明还指出,Fable 5 在发布前通过了数千小时的红队测试,其安全防护是迄今已部署模型中最强的,没有任何测试者找到过通用越狱方法。
WSJ 和 TechCrunch 的后续报道揭示了一个关键背景:Amazon CEO Andy Jassy 向财长 Scott Bessent 等政府官员汇报,称 Amazon 的研究人员用 Claude Fable 5 获取了可用于网络攻击的信息。这可能是触发出口管制的直接原因。Amazon 回应称“政府经常就潜在安全风险征求我们的意见”,但否认主动要求封禁。
链接:Statement on the US government directive to suspend access to Fable 5 and Mythos 5
链接:Amazon CEO reportedly raised Anthropic model concerns before government crackdown
Simon Willison 记录了切断过程:他编写脚本轮询 API,发现自己的 Fable 5 权限在 6 月 12 日美西时间 6:59pm 正式切断,API 返回 404,提示“Claude Fable 5 is not available”。
链接:Statement on the US government directive to suspend access to Fable 5 and Mythos 5
Anthropic 在声明末尾警告,如果这个标准被应用到全行业,实际上将停止所有前沿模型的新部署。
Microsoft SkillOpt:用 Markdown 文件当模型权重来训练
Microsoft 联合三所中国高校发表了一篇名为 SkillOpt 的研究,展示了一种极简的模型优化思路:把一份 Markdown 格式的指令文档(他们称为“skill”)当作模型参数一样去迭代优化,最终让 GPT-5.5 在程序化任务上提升了超过 20 个百分点。
链接:Microsoft's SkillOpt boosts GPT-5.5 by using nothing but a trained Markdown file
Skill 这个概念不新鲜 - Anthropic 去年就给 Claude 加了模块化 skill 系统,会自动加载特定任务的指令、脚本和资源。但 SkillOpt 的关键区别在于,它不再靠手工或单次生成来写 skill,而是引入了一个独立的语言模型作为优化器,记录 agent 运行日志后识别错误和成功模式,然后对 skill 做编辑增删。每次修改只有通过验证集的性能检验才会被保留。
作者把深度学习概念映射到了文本层面:每步限制可编辑的段落数量作为学习率,调度器按 epoch 缩小步长,被拒绝的编辑进入缓存作为负面样本,epoch 末的慢更新保留稳定的编辑方向 - 和梯度平滑如出一辙。一个参数不调,只调 prompt。
KPMG 因幻觉撤回自己的 AI 报告
咨询巨头 KPMG 撤回了 2025 年 10 月发布的报告《Redefining Excellence in the Age of Agentic AI》,原因是多家被调研机构声称报告中关于它们的 AI 使用情况不实。GPTZero 研究团队指出,不准确信息来源于 AI 幻觉,且 KPMG 很可能用 AI 辅助撰写了一份关于 AI 的行业报告。
链接:KPMG pulls report on AI usage due to apparent hallucinations
UBS、英国 NHS、瑞士联邦铁路和伦敦交通局均向 FT 表示报告中的声明不实或误导。KPMG 发言人回应称已启动内部调查,强调“要求所有员工遵循负责任使用 AI 的准则,包括人工审查内容和验证独立来源”。上个月 EY 也因报告包含虚假脚注而撤回了一份关于忠诚度计划的报告 - 四大咨询机构在 AI 议题上的信任危机正在蔓延。
GLM 5.2 发布,下周开源权重
智谱 AI 发布了 GLM 5.2,并在社交平台表示下周将开放 MIT 许可证的权重。在社区测试中,GLM 5.2 的表现存在分歧:Reddit 上有用户认为其在 Pac-Man 测试中表现不错,也有用户对 5.2 Air 版本的成绩表示疑虑,认为可能还有 Flash 版本会在后续放出。
GLM 5.2 Is Out
Kimi K2.7 Code 以 12 倍价格优势对标 GPT-5.5 和 Claude
Moonshot 开源了 Kimi K2.7 Code,定位是性价比极高的代码模型。The Decoder 报道称其每 token 成本比 GPT-5.5 和 Claude 低最多 12 倍,Unsloth 已经发布了 GGUF 量化版本供本地运行。
链接:Moonshot's open model Kimi K2.7 Code undercuts GPT-5.5 and Claude by up to 12x on price per token
OpenAI WebRTC 语音会话支持文档上下文
Simon Willison 更新了 openai-webrtc 浏览器工具,新增对 GPT-Realtime-2 模型的支持 - OpenAI 称其为“首个具备 GPT-5 级别推理能力的语音模型”。新版本允许用户在浏览器中粘贴大量文档内容,然后通过语音与模型讨论这些信息,把语音交互从简单的对话扩展到了文档分析场景。
链接:OpenAI WebRTC Audio Session, now with document context
其他值得关注的动态
Google DeepMind 的语言模型可解释性团队在 AI Alignment Forum 发表研究,发现 Gemini 的安全相关属性主要来自 SFT(监督微调),而非 RL 或其他阶段 - SFT-only 模型和生产版本在所有安全基准上高度重合,包括对齐评估、过度拒绝率和不安全响应率。
Google Research 的 Gemini-SQL2 在 text-to-SQL 基准测试中大幅领先。Claude Fable 5 在被封禁前刚被报道在 FrontierMath 最难问题上超过 GPT-5.5 达 13 个百分点。OpenAI 也面临来自美国各州总检察长的调查。微软 CEO Satya Nadella 在采访中承认自己也是个“token maxer”,表示“这东西上瘾”。
来源:VerySmallWoods Research Feed - 2026-06-14 UTC
相关文章
2026年6月19日
【AI早读0619】GLM-5.2登顶开源,智能体安全框架密集发布
GLM-5.2 以 753B MoE、百万 token 上下文和 IndexShare 稀疏注意力机制登顶开放权重模型;Google DeepMind 发布 AI Control 路线图,Amazon Bedrock AgentCore 正式 GA,智能体安全与运行基础设施同步加速。
2026年5月31日
【AI早读 0531】Anthropic 把 Claude「关在笼子里」的安全设计
Anthropic 公开了三条产品线的 Agent 隔离方案 - claude.ai 用 gVisor、Claude Code 用 Seatbelt/Bubblewrap、Cowork 用全 VM;Claude Code 早期 93% 的批准率反而成为安全风险,被 auto mode + 架构改造替代;AI Engineer 大会上「砍掉 95% Agent 技能反而更好」成为新共识;SoftBank €750 亿建法国数据中心,OpenRouter 完成 $1.13 亿 B 轮。
2026年5月30日
【AI早读 0530】AI安全评估与Agent技能蒸馏
今天聚焦四条技术线:Gemini 的 scheming 倾向评估、OpenAI 面向第三方评测的可信方法论、把复杂 Agent 行为蒸馏为可复用技能,以及前沿模型在生物安全领域带来的新防御问题。
最近一封 · Sample
【AI早读 0620】AI Agent 重塑软件生命周期
“Google 的新软件生命周期白皮书把 Agent 定义为“模型加 harness”,强调 Context Engineering、验证和渐进式披露;多篇实践进一步展示 Agent 如何从写代码延伸到部署、数据分析、信息检索和云平台运维。”
—— william
来信
里面装的是
- 新文章 — 写完一篇就寄一封,不攒货
- 这周读到的、看到的、好用的工具
- 正在折腾的实验,附带翻车记录
约莫 1–2 周一封 · 随时退订
合作伙伴
CompeteMap — 英国及爱尔兰学生竞赛一站式搜索
数学、编程、科学、写作等各类竞赛信息汇总,支持按年龄和科目筛选,再也不错过报名截止日。