博客

写作与笔记

记录 AI 系统、产品思考与创作者工作流的实践。

2026年5月31日

【AI早读 0531】Anthropic 把 Claude「关在笼子里」的安全设计

Anthropic 公开了三条产品线的 Agent 隔离方案 - claude.ai 用 gVisor、Claude Code 用 Seatbelt/Bubblewrap、Cowork 用全 VM;Claude Code 早期 93% 的批准率反而成为安全风险,被 auto mode + 架构改造替代;AI Engineer 大会上「砍掉 95% Agent 技能反而更好」成为新共识;SoftBank €750 亿建法国数据中心,OpenRouter 完成 $1.13 亿 B 轮。

2026年5月28日

【AI早读 0528】智能体评测与进化

ITBench-AA 显示所有前沿模型在企业级 IT 智能体任务上均低于 50%;OpenAI 与 Thrive 的 Tax AI 案例展示了 Codex 如何把生产纠错变成自改进循环;Warp 用 GPT-5.5 推动开源智能体开发;Alignment Forum 讨论评测博弈与 AI 研发自动化。

2026年5月27日

【AI早读 0527】Agent安全

今天围绕 Agent 安全与运行基础设施展开:Copilot Cowork 被披露可通过间接 Prompt 注入外泄文件;AWS 从 AgentWatch、AgentCore Memory 到多 Agent 运行时持续补齐平台能力;Agent Gravity 则提出一个关键问题:未来究竟由谁来运行你的 Agent?

2026年5月27日

Greg Isenberg 硅谷观察 - SaaS 没死,但亿万富翁正在批量收购、压缩岗位、用 agent 重写

SaaS 没死,但亿万富翁正在批量把它们买下来、压缩岗位、按 agent-first 重写、然后提价。MCP 成了新的 SEO;模型忠诚度死了;forward-deployed engineer 是 SF 现在最热的岗位;agent debt 已经是真实的工程问题。这些是 Greg Isenberg 刚结束在旧金山 5 天后,在 X 上写下的 17 条 takeaway,我把它完整翻译过来。

2026年5月26日

【AI早读 0526】Addy Osmani 提出「你才是编排税」,Hugging Face 重新区分 Model / Scaffolding / Harness / Agent

Addy Osmani 用 Python GIL 比喻揭穿多 agent 并发的真正瓶颈 - 是开发者本人;Hugging Face 发出官方词汇表,把 Model / Scaffolding / Harness / Agent 这四个被混用的概念锚定下来;Google DeepMind 的 Nicholas Kang 与 Michael Aaron 分享大规模 agent 评估的工程化做法;Bounded Autonomy 把「自由意志 vs 确定性」落到 harness 工程里;Simon Willison 发布 datasette 1.0a30 的可扩展 Jump 菜单 + datasette-agent 联动。

2026年5月26日

腾讯开源 TencentDB Agent Memory:给 OpenClaw 和 Hermes Agent 接上 4 层本地长期记忆

腾讯 4 月初放出 TencentDB Agent Memory,7 周攒下 4.1K stars。它的思路有点反潮流 - 不再把对话历史塞进扁平向量库,而是建一座 L0 Conversation → L1 Atom → L2 Scenario → L3 Persona 的语义金字塔;短期任务状态再用 Mermaid 符号图替代工具日志。已经支持 OpenClaw 插件和 Hermes Agent 镜像,在 PersonaMem 上把准确率从 48% 拉到 76%,WideSearch 上 token 消耗砍掉 61%。这篇拆开看它的两根支柱、两条集成路径,和几段值得抄走的工程实现。

上一页4 页 / 共 18下一页