博客

写作与笔记

记录 AI 系统、产品思考与创作者工作流的实践。

2026年5月31日

【AI早读 0531】Anthropic 把 Claude「关在笼子里」的安全设计

Anthropic 公开了三条产品线的 Agent 隔离方案 - claude.ai 用 gVisor、Claude Code 用 Seatbelt/Bubblewrap、Cowork 用全 VM；Claude Code 早期 93% 的批准率反而成为安全风险，被 auto mode + 架构改造替代；AI Engineer 大会上「砍掉 95% Agent 技能反而更好」成为新共识；SoftBank €750 亿建法国数据中心，OpenRouter 完成 $1.13 亿 B 轮。

AI Daily Anthropic AI Agent Sandbox Agent Skills

2026年5月30日

【AI早读 0530】AI安全评估与Agent技能蒸馏

今天聚焦四条技术线：Gemini 的 scheming 倾向评估、OpenAI 面向第三方评测的可信方法论、把复杂 Agent 行为蒸馏为可复用技能，以及前沿模型在生物安全领域带来的新防御问题。

AI Daily AI 安全模型评估 Agent Skills 生物安全

2026年5月29日

【AI早读 0529】Anthropic 一日三发 - Opus 4.8、$965B、Mythos

5 月 28 日 Anthropic 同日完成三项发布 - Claude Opus 4.8 上线，SWE-bench Pro 提升 4.9pp、Terminal-Bench 2.1 提升 8.5pp，Honesty 成为第一特性，对齐质量逼近 Mythos；650 亿美元 Series H 把估值推到 9650 亿，超过 OpenAI；Mythos 将在数周内向全量客户开放。

AI Daily Anthropic Claude

2026年5月28日

【AI早读 0528】智能体评测与进化

ITBench-AA 显示所有前沿模型在企业级 IT 智能体任务上均低于 50%；OpenAI 与 Thrive 的 Tax AI 案例展示了 Codex 如何把生产纠错变成自改进循环；Warp 用 GPT-5.5 推动开源智能体开发；Alignment Forum 讨论评测博弈与 AI 研发自动化。

AI Daily AI Agent Codex

2026年5月27日

【AI早读 0527】Agent安全

今天围绕 Agent 安全与运行基础设施展开：Copilot Cowork 被披露可通过间接 Prompt 注入外泄文件；AWS 从 AgentWatch、AgentCore Memory 到多 Agent 运行时持续补齐平台能力；Agent Gravity 则提出一个关键问题：未来究竟由谁来运行你的 Agent？

AI Daily AI Agent AI 安全 Prompt 注入 AWS

2026年5月27日

Greg Isenberg 硅谷观察 - SaaS 没死，但亿万富翁正在批量收购、压缩岗位、用 agent 重写

SaaS 没死，但亿万富翁正在批量把它们买下来、压缩岗位、按 agent-first 重写、然后提价。MCP 成了新的 SEO；模型忠诚度死了；forward-deployed engineer 是 SF 现在最热的岗位；agent debt 已经是真实的工程问题。这些是 Greg Isenberg 刚结束在旧金山 5 天后，在 X 上写下的 17 条 takeaway，我把它完整翻译过来。

AI Agent MCP AI 创业

2026年5月26日

【AI早读 0526】Addy Osmani 提出「你才是编排税」，Hugging Face 重新区分 Model / Scaffolding / Harness / Agent

Addy Osmani 用 Python GIL 比喻揭穿多 agent 并发的真正瓶颈 - 是开发者本人；Hugging Face 发出官方词汇表，把 Model / Scaffolding / Harness / Agent 这四个被混用的概念锚定下来；Google DeepMind 的 Nicholas Kang 与 Michael Aaron 分享大规模 agent 评估的工程化做法；Bounded Autonomy 把「自由意志 vs 确定性」落到 harness 工程里；Simon Willison 发布 datasette 1.0a30 的可扩展 Jump 菜单 + datasette-agent 联动。

AI Daily AI Agent Agent Skills

2026年5月26日

腾讯开源 TencentDB Agent Memory：给 OpenClaw 和 Hermes Agent 接上 4 层本地长期记忆

腾讯 4 月初放出 TencentDB Agent Memory，7 周攒下 4.1K stars。它的思路有点反潮流 - 不再把对话历史塞进扁平向量库，而是建一座 L0 Conversation → L1 Atom → L2 Scenario → L3 Persona 的语义金字塔；短期任务状态再用 Mermaid 符号图替代工具日志。已经支持 OpenClaw 插件和 Hermes Agent 镜像，在 PersonaMem 上把准确率从 48% 拉到 76%，WideSearch 上 token 消耗砍掉 61%。这篇拆开看它的两根支柱、两条集成路径，和几段值得抄走的工程实现。

AI Agent Agent Memory OpenClaw Hermes Agent Tencent