2026年5月22日
【AI早读 0522】OpenAI 攻克 Erdős 猜想,AWS、SageMaker、Microsoft 智能体齐发
OpenAI 推理模型用不到 $1000 的算力推翻一个悬置 80 年的 Erdős 猜想;AWS 同一天密集发布 6+ 篇 Bedrock AgentCore 技术博客,SageMaker 推出 OpenAI 兼容 API - 推理能力进化与智能体基建定型并行。
2026年5月22日
OpenAI 推理模型用不到 $1000 的算力推翻一个悬置 80 年的 Erdős 猜想;AWS 同一天密集发布 6+ 篇 Bedrock AgentCore 技术博客,SageMaker 推出 OpenAI 兼容 API - 推理能力进化与智能体基建定型并行。
2026年5月20日
两个大事件撞在同一天 - Andrej Karpathy 加入 Anthropic 主攻预训练,Google I/O 2026 发布 Gemini 3.5 Flash;外加 Claude Managed Agents 上线 Cloudflare、AWS 推出 Programmatic Tool Calling。
2026年5月19日
今天聚焦 Agent 从评估到部署 - IBM 跨场景排行榜、OpenAI×Dell 把 Codex 推进企业本地环境、Anthropic 谈长时任务稳定性,以及一份系统的 Agent 评估指南。
2026年5月15日
a16z 这周发了一篇观点文章 - From System of Record to System of Intelligence。同一天 Notion 把工作区改造成 AI agent hub。两件事放一起看,是 SaaS 产品形态的一次方向调整 - 入口正在从“我帮你把数据存好”挪到“我帮你拉所有上下文做事”。
2026年5月13日
Anthropic 工程师 Thariq Shihipar 5 月初发了一条“HTML is the new markdown”,附了 20 个由 Claude Code 产出的单文件 HTML 示例。Simon Willison 第二天宣布放弃用了三年的 Markdown 默认值。这件事值得跟一跟 - 不是 HTML 全面胜出,而是 agent 输出三年前和现在已经是两回事。
2026年5月9日
Cloudflare 这周让 agent 能自己开账号、注册域名、付费、部署。听起来像把控制权交了出去,但其实没有 - 它把控制点从 agent 的执行边缘挪到了协议层。这是个完全不一样的 agent 安全哲学,也是把 agent 当成 first-class 客户类别的开始。
2026年5月7日
Code Mode MCP 把 1.17M tokens 的 API 压成 1K,Agent Memory 把对话历史压成可索引的结构化记忆。两个公告分开看是产品发布,放一起看是同一个判断 - agent 跑不动了,得重新设计存储层。
2026年5月7日
GPT-Realtime-2 把 GPT-5 的推理塞进语音,Translate 把同传打到 $0.034 一分钟,Whisper 做流式 STT,外加重写的 WebRTC 跑在 Cloudflare 边缘上。拼起来是一句话 - voice agent 终于可以做事,不只是聊天。
2026年4月27日
Pi、OpenClaw、Claude Code、Letta 在文件读取、会话压缩、子 Agent 隔离上做了不同的选择,但仔细比对会发现,它们正在收敛到同一套设计模式。Arize 创始人 Aparna Dhinakaran 把四个代码库摊在一起做了对照。
2026年4月4日
一行命令装好,CEO 自己招了 CTO,CTO 自己领了任务,16 个 Issue 自动生成。全程 $0 费用。这是我用 Paperclip 搭建 AI Agent 团队的完整记录。
2026年4月3日
四个主流 AI Agent 框架的真实使用体验对比。不吹不黑,说说各自的优缺点和适用场景。
2026年3月29日
飞书命令行工具刚开源,我拿它配合 Claude Code 搭了个 A 股每日跟踪系统:多维表格管理持仓、自动抓取行情数据、一句话创建盘中提醒。从安装到跑通,全程自然语言驱动。
2026年3月20日
Anthropic 刚发布了 Claude Code Channels,让你通过 Telegram 远程操控 Claude Code。手机发条消息,它就在你电脑上干活。这篇讲清楚它是什么、怎么配、能干嘛。
2026年3月12日
百度在公司楼下办了个龙虾市集帮人装 OpenClaw,腾讯爬光了 ClawHub 做了个 SkillHub。创始人 steipete 说:你们吃得很开心,账单能看一眼吗?
2026年3月6日
MCP 工具一直只能返回文本。现在 MCP Apps 让工具可以返回完整的交互式界面 - 表单、仪表盘、3D 模型、实时监控 - 直接嵌在对话里。这是 MCP 协议最重要的一次扩展。
2026年2月27日
Claude Code 刚上线了 Auto Memory 功能。加上原有的 CLAUDE.md 体系,它现在有六层记忆结构。这篇拆解每层的用途、加载时机,以及怎么用才不会变成负担。
2026年2月27日
Docker 去年底推出了 Sandbox,用 microVM 隔离 AI Agent,API Key 通过网络代理注入,Agent 本身拿不到密钥。核心解决的是信任边界问题 - 你不完全信任 Agent 时才需要它。
2026年2月24日
Ollama 0.17 新增 launch 命令,一行搞定 OpenClaw 的安装、配置和启动。开放模型跑个人 AI 助手从没这么简单过。
2026年2月21日
当 API 有 2500 个端点时,传统 MCP 方案要吃掉 117 万 token。Cloudflare 的 Code Mode 只用两个工具把这个数字压到 1000。背后的思路比技术本身更值得看。
2026年2月17日
Next.js 团队发布了一篇博客,讲述他们如何从 Agent 的视角重新思考框架设计。从一个被放弃的浏览器内 Agent,到 MCP 集成,再到 agents.md - 这篇是我的阅读笔记。
2026年2月12日
系统提示词占了多少 token?工具定义有多大?发个 /context 就知道了。
2026年2月9日
从 OpenClaw 一次关掉 60+ cron issues 的重构中,提炼出 Agent 定时任务系统的七个可靠性教训:亚秒精度陷阱、LLM 调用必须有超时、失败退避不能省、单次任务的死循环、投递上下文会过期、重复管道要合并、以及 —— 不是所有模型都会按你的 schema 传参。
2026年2月6日
深入 Claude Code Hooks 机制:配置格式、事件生命周期、三种钩子类型,以及一个真实案例 - 如何用 Hooks 驱动桌面宠物实时反映 AI 编码状态。
2026年2月6日
深入 OpenCode 源码,解析其三层 Hooks 架构:类型安全的事件总线、插件生命周期钩子、以及配置驱动的实验性钩子。理解编码智能体如何在松耦合的前提下实现精确的行为控制。
2026年2月5日
深入解析 OpenClaw 的创新设计 SOUL.md —— 一个让 AI Agent 拥有人格、边界和灵魂的文件系统,以及它背后的哲学思考。
2026年2月4日
通过源码分析,揭示 OpenClaw 如何通过模块化提示词架构、动态上下文注入、安全护栏和行为引导,让 AI Agent 更高效、更智能地完成复杂任务。
2026年2月2日
通过源码分析,详解 OpenClaw 如何实现多智能体协作、动态提示词构建、工具系统和长时任务执行,揭示其超越 Claude Code 的技术秘密。
2026年1月20日
LangChain 创始人 Harrison Chase 的文章:Agent 不是传统软件,你无法预测它在生产环境中的行为。当每天产生 10 万条 Traces 时,传统分析方法的局限性就显现出来了。
2025年1月31日
Pydantic AI:构建 Agentic LLM 应用程序的类型安全 AI Agent 框架。随着 Pydantic AI v0.0.21 的最新发布,该框架带来了大量新特性和改进,在 AI 开发社区获得了重要关注。