2026年5月7日
Cloudflare 一周拆了 Agent 的两堵墙:Code Mode MCP 与 Agent Memory
Code Mode MCP 把 1.17M tokens 的 API 压成 1K,Agent Memory 把对话历史压成可索引的结构化记忆。两个公告分开看是产品发布,放一起看是同一个判断 - agent 跑不动了,得重新设计存储层。
博客
记录 AI 系统、产品思考与创作者工作流的实践。
2026年5月7日
Code Mode MCP 把 1.17M tokens 的 API 压成 1K,Agent Memory 把对话历史压成可索引的结构化记忆。两个公告分开看是产品发布,放一起看是同一个判断 - agent 跑不动了,得重新设计存储层。
2026年5月7日
GPT-Realtime-2 把 GPT-5 的推理塞进语音,Translate 把同传打到 $0.034 一分钟,Whisper 做流式 STT,外加重写的 WebRTC 跑在 Cloudflare 边缘上。拼起来是一句话 - voice agent 终于可以做事,不只是聊天。
2026年5月6日
OpenAI 把 ChatGPT 的默认模型从 GPT-5.3 Instant 升到了 GPT-5.5 Instant。发布页那篇博客只讲了三件事 - 幻觉减半、回答更短、记忆更聪明;但如果再翻一下官方的 System Card,会发现还有第四件 - 这是 OpenAI 第一次让默认 Instant 模型跨过 High capability 门槛。
2026年4月27日
Pi、OpenClaw、Claude Code、Letta 在文件读取、会话压缩、子 Agent 隔离上做了不同的选择,但仔细比对会发现,它们正在收敛到同一套设计模式。Arize 创始人 Aparna Dhinakaran 把四个代码库摊在一起做了对照。
2026年4月16日
Anthropic 今天发布 Opus 4.7。价格没变、上下文没变,但 SWE-bench Pro 涨了差不多 11 个百分点,第一次支持高分辨率看图,指令遵循也更严格。对开发者来说,这是一次值得立刻换的免费升级。
2026年4月5日
2026 年一个人做 SaaS 产品,从代码到上线到收款,完整的技术栈选择和踩坑经验。AI 工具让独立开发的效率翻了好几倍。
2026年4月4日
一位自称 Oracle 副总裁的人,用一条推文拆解了美国科技公司裁员-换血-压薪的完整运作逻辑。这一切都是商业,都是生意。
2026年4月4日
一行命令装好,CEO 自己招了 CTO,CTO 自己领了任务,16 个 Issue 自动生成。全程 $0 费用。这是我用 Paperclip 搭建 AI Agent 团队的完整记录。