【AI早读 0529】Anthropic 一日三发 - Opus 4.8、$965B、Mythos
摘要
5 月 28 日 Anthropic 同日完成三项发布 - Claude Opus 4.8 上线,SWE-bench Pro 提升 4.9pp、Terminal-Bench 2.1 提升 8.5pp,Honesty 成为第一特性,对齐质量逼近 Mythos;650 亿美元 Series H 把估值推到 9650 亿,超过 OpenAI;Mythos 将在数周内向全量客户开放。

今天这一期是 Anthropic 的独立故事 - 5 月 28 日这家公司在一个日历日里完成了三重发布,每条单独拿出来都够做一期头条。
Claude Opus 4.8:不是能力跳跃,是可靠性跃迁
5 月 28 日上线,全线可用(claude.ai / API / Claude Code / Cowork),定价不变:$5 / $25 per 1M tokens。
关键基准:
| 基准 | Opus 4.8 | Opus 4.7 | 对比 |
|---|---|---|---|
| SWE-bench Verified | 88.6% | 87.6% | +1.0pp |
| SWE-bench Pro | 69.2% | 64.3% | +4.9pp |
| Terminal-Bench 2.1 | 74.6% | 66.1% | +8.5pp |
| Online-Mind2Web | 84% | ~76% | +~8pp |
| 计算机使用 Agent | SOTA | - | 超越 4.7 和 GPT 5.5 |
跑分只是门面。真正重要的变化是四个。
Honesty 是第一特性
Anthropic 对齐团队的数据:Opus 4.8 对自己代码中的缺陷「视而不见」的概率比 4.7 低约 4 倍。在真实代码审查场景中,它会主动标记不确定性,而不是自信地把错误结论交出去。
企业客户的反馈很一致 - 「更可靠的队友」、「在复杂多服务探索中会先建立信心再动代码」、「会主动质疑自己的输入和输出」。ZDNet 的标题直写「honesty 是 killer feature」 - 在一众追求 AGI 跑分的行业里,这个差异化很有意思。
对齐质量接近 Mythos 水平
在「失对齐行为」(欺骗、协助滥用等)的多轮模拟评估中:
- Opus 4.7:2.5
- Opus 4.8:1.9
- Mythos Preview:~1.8
Opus 4.8 的对齐退化率已经和受限版的 Mythos 几乎持平。对安全敏感的企业场景来说,这意味着 AI Agent 可以承担更大范围的自主工作而不会失控。
Dynamic Workflows:并行子 Agent 架构
这是发布中架构层面最有想象力的一条。
在 Claude Code 中,Claude 现在可以规划一个大型任务,在一个会话中并行启动数百个子 Agent 各自执行,自我验证后再汇报给用户。演示场景是全代码库迁移 - 几十万行代码,从 kickoff 到 merge,已有测试套件做验证护栏。
这条的能力含义远不止代码迁移。这是 Anthropic 对 Agent 架构的重要声明:他们相信并行子 Agent 是解决长周期、大规模自主任务的正确路径。单个上下文窗口不够用?那就拆成子任务并行跑。
动态工作流目前在 Claude Code Enterprise / Team / Max 计划中以 research preview 形式可用。
Fast Mode 降价 3 倍 + Effort Control
Fast Mode(~2.5x 推理速度)从 $30/$150 降到 $10/$50 per 1M tokens。对延迟敏感的生产工作负载来说 - 比如客服 Agent、实时代码补全 - 这个降价是实质性的。
Effort Control 在 claude.ai 和 Cowork 上新增了一个调节旋钮,控制 Claude「思考多深」 - 高努力花更多 token 换更高质量,低努力响应更快省配额。用户层面的小功能,但在 API 层(通过 system entries 支持 mid-task 指令更新)做的是同一件事:让开发者对模型的行为开销有更精细的控制。
$965B:Anthropic 超越 OpenAI
同一天,Anthropic 宣布完成 $650 亿 Series H,投后估值 $9650 亿 - 正式超越 OpenAI 的 $7300 亿估值,成为全球估值最高的 AI 公司。
Altimeter Capital、Dragoneer、Greenoaks、Sequoia Capital 领投。这被认为是 Anthropic 上市前的最后一轮私募融资。
关键驱动不是模型跑分,是企业营收:
- KPMG:276,000+ 名员工全面整合 Claude
- PwC:30,000 人通过
Claude Code/ Cowork 认证培训 - Accenture:大规模企业部署
- Goldman Sachs / Blackstone:联合 $15 亿成立企业 AI 服务公司
Anthropic 的企业路线走得比市场预期更快。从收购 Stainless(API SDK/MCP 工具链)到行业垂直方案(金融 Agent、法律连接器),再到对齐方法论 - 他们在从模型公司向「全栈企业 AI 平台」转型。
Mythos 即将全量开放
Anthropic 确认:Claude Mythos 将在未来几周内向所有客户开放。
Mythos Preview 目前仅通过 Project Glasswing 向少数安全机构开放。Cloudflare 上周发布了一份实战报告 - Mythos 扫描了 Cloudflare 的 50+ 仓库,在真实漏洞发现上远超通用前沿模型(虽然假阳性率仍然偏高,需要人在 loop 里判断)。
Anthropic 内部能力阶梯:Mythos 的能力级显著高于 Opus 4.8。今天 Opus 4.8 的对齐质量(1.9)已经接近 Mythos Preview(~1.8),意味着全量开放前的安全护栏已基本到位。
Glasswing 本身也值得关注 - 联合了 AWS、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks 共 13 家机构,做「地球上最关键软件的安全」。AI 找漏洞、修复软件供应链、安全 Agent 第一个大规模落地 - 这可能是 2026 年 AI 最有实质性社会影响的场景之一。
五月 Anthropic 全景
Opus 4.8 不是孤立事件。回看 Anthropic 五月的整体节奏,能看到一条清晰的扩张主线:
| 日期 | 事件 | 意义 |
|---|---|---|
| 5/4 | 与 Blackstone / GS 联合成立 $15 亿企业 AI 服务公司 | 资本层面绑定最头部的 PE/投行 |
| 5/5 | 10 个金融 Agent 发布 | 行业垂直的第一块拼图 |
| 5/7 | Claude for Small Business | 15 个工作流模板 + 7 个集成,下探中小企业 |
| 5/14 | 法律行业:20+ 连接器 + 12 个细分领域插件 | 专业服务行业的深入渗透 |
| 5/19 | Project Glasswing 初始报告 | 安全到全社会关键基础设施 |
| 5/22 | Chris Olah 回应教皇通谕 | AI 伦理公共对话 |
| 5/28 | Opus 4.8 + $965B + Mythos 预告 | 三重发布 |
收购 Stainless 在 5/17 前后完成,API 基础层的 SDK/MCP 工具链能力补齐。
从 Opus 4.8 的功能堆叠(Dynamic Workflows + Honesty + Effort Control)到 Mythos 全量开放的倒计时,再到 $965B 估值和五月全系列产品发布 - Anthropic 本周不是在发布一个模型,而是在发布一个公式:AI 公司 = 模型 × 平台 × 行业渗透 × 对齐可信度。
Opus 4.8 的架构信号(并行子 Agent)和信任信号(Honesty / 对齐)可能比它的跑分重要得多 - 因为企业 Agent 落地最大的两个障碍,恰恰是能跑多久不出错,和出了问题能不能信任。
来源:VerySmallWoods Research Feed - 2026-05-28 UTC
相关文章
2026年6月12日
【AI早读0612】OpenAI收购Ona为Codex构建持久化Agent执行环境
今天的主线是 AI Agent 正在走向“生产级”:OpenAI 收购 Ona,给 Codex 补上持久化云端执行 —— 电脑离线后 Agent 仍能在企业自有云里接着跑。Google Cloud 用 TEE 推出 Confidential AI 保护推理数据;Anthropic 发布企业订阅 Claude Corps 并联合 DXC 进入受监管行业;AWS 开源 Agent-EvalKit 系统化评估 Agent 全执行链路;再加 DeepMind“模型察觉被评估反而表现更差”的研究与多 Agent 安全投资。
2026年6月8日
【AI早读 0608】Agent 生态加速成熟,多智能体与平台战并进
过去 24 小时 AI 圈关键词是 Agent:Towards Data Science 把 Python 多智能体教程推成中级实践;AI Engineer 频道两场分享指向 Agent 从原型走向规模化 - MCP 管道与 LLM 可观测性;OpenAI 据 FT 报道要把 ChatGPT 重构成集成 Codex 的“超级应用”,内部一句“Chat is dead”;Ramp 数据显示 DeepSeek 登顶增长最快的软件供应商,价格驱动的“Token 经济”成形;Notion 因 Anthropic Opus 4.7/4.8 抖动一度禁用全部 Anthropic 模型;The Algorithmic Bridge 深扒 Anthropic 如何用安全叙事影响特朗普政府的 AI 政策。
2026年5月31日
【AI早读 0531】Anthropic 把 Claude「关在笼子里」的安全设计
Anthropic 公开了三条产品线的 Agent 隔离方案 - claude.ai 用 gVisor、Claude Code 用 Seatbelt/Bubblewrap、Cowork 用全 VM;Claude Code 早期 93% 的批准率反而成为安全风险,被 auto mode + 架构改造替代;AI Engineer 大会上「砍掉 95% Agent 技能反而更好」成为新共识;SoftBank €750 亿建法国数据中心,OpenRouter 完成 $1.13 亿 B 轮。
最近一封 · Sample
【AI早读 0613】智能体主动性飞跃与模型评估新范式
“今天聚焦智能体的两个方向加一个底层动向:Simon Willison 记录 Claude Fable 5 的“relentlessly proactive” —— 为查一个滚动条 bug 自主注入代码、自写诊断 HTTP 服务、跨浏览器截图验证,是有意图的多步自纠探索;Google DeepMind 提出“模型 diffing”新范式,让审计智能体自主构造 prompt 主动搜索两个模型的行为差异;Google Cloud 发布 Open Knowledge Format,用带 YAML frontmatter 的 Markdown 为 AI 的结构化知识建开放标准。能力、评估、基础设施三条线正拼成智能体开发的完整图景。”
—— william
来信
里面装的是
- 新文章 — 写完一篇就寄一封,不攒货
- 这周读到的、看到的、好用的工具
- 正在折腾的实验,附带翻车记录
约莫 1–2 周一封 · 随时退订
合作伙伴
CompeteMap — 英国及爱尔兰学生竞赛一站式搜索
数学、编程、科学、写作等各类竞赛信息汇总,支持按年龄和科目筛选,再也不错过报名截止日。