AI Agent

共 54 篇文章

2026年6月20日

【AI早读 0620】AI Agent 重塑软件生命周期

Google 的新软件生命周期白皮书把 Agent 定义为“模型加 harness”，强调 Context Engineering、验证和渐进式披露；多篇实践进一步展示 Agent 如何从写代码延伸到部署、数据分析、信息检索和云平台运维。

2026年6月19日

【AI早读0619】GLM-5.2登顶开源，智能体安全框架密集发布

GLM-5.2 以 753B MoE、百万 token 上下文和 IndexShare 稀疏注意力机制登顶开放权重模型；Google DeepMind 发布 AI Control 路线图，Amazon Bedrock AgentCore 正式 GA，智能体安全与运行基础设施同步加速。

AI Daily GLM-5.2 LLM AI 安全 AI Agent

2026年6月17日

【AI早读 0617】模拟部署预测模型安全，OpenAI 发布 Deployment Simulation

OpenAI 发布 Deployment Simulation，用真实对话分布模拟新模型上线后的行为，在发布前预测安全风险；Martin Fowler 网站则通过 Bayer 的 PRINCE 案例，总结 Context Discipline 与 Harness Engineering 如何提升 Agentic RAG 系统可靠性。

AI Daily OpenAI AI 安全 AI Agent RAG

2026年6月16日

今天三篇 AWS importance 5 的博客串成一条线：Strands Evals SDK 用 Detector 自动分析 Agent 的执行轨迹，给出故障分类、因果链和具体修复建议，把“诊断瓶颈”从人工压成自动化；LangChain Deep Agents + Bedrock AgentCore 用“委派 - 隔离 - 汇总”的子 Agent 架构构建研究代理，每个子 Agent 跑在自己的 MicroVM 里；Google DeepMind 的 Gemma 4 系列正式登陆 Amazon Bedrock，主打 intelligence-per-parameter。

AI Daily AI Agent AWS Gemma 4 Agents SDK

2026年6月13日

【AI早读 0613】智能体主动性飞跃与模型评估新范式

今天聚焦智能体的两个方向加一个底层动向：Simon Willison 记录 Claude Fable 5 的“relentlessly proactive” —— 为查一个滚动条 bug 自主注入代码、自写诊断 HTTP 服务、跨浏览器截图验证，是有意图的多步自纠探索；Google DeepMind 提出“模型 diffing”新范式，让审计智能体自主构造 prompt 主动搜索两个模型的行为差异；Google Cloud 发布 Open Knowledge Format，用带 YAML frontmatter 的 Markdown 为 AI 的结构化知识建开放标准。能力、评估、基础设施三条线正拼成智能体开发的完整图景。

AI Daily AI Agent Claude Fable 5 模型评估 Google

2026年6月12日

【AI早读0612】OpenAI收购Ona为Codex构建持久化Agent执行环境

今天的主线是 AI Agent 正在走向“生产级”：OpenAI 收购 Ona，给 Codex 补上持久化云端执行 —— 电脑离线后 Agent 仍能在企业自有云里接着跑。Google Cloud 用 TEE 推出 Confidential AI 保护推理数据；Anthropic 发布企业订阅 Claude Corps 并联合 DXC 进入受监管行业；AWS 开源 Agent-EvalKit 系统化评估 Agent 全执行链路；再加 DeepMind“模型察觉被评估反而表现更差”的研究与多 Agent 安全投资。

AI Daily OpenAI Codex AI Agent Anthropic

2026年6月11日

【AI早读 0611】Google AI 三连发：DiffusionGemma、Managed Agents 与 ML 遗忘审计

Google 昨天一天连发三项：用扩散架构把文本生成提速 4 倍的 DiffusionGemma、一行 SDK 背后拉起 4 vCPU 沙箱的 Gemini Managed Agents，以及给「机器遗忘」做置信度评估的审计框架。再加上 GitHub Copilot CLI 接入 LSP 拿到语义级代码理解，以及 Simon Willison 对 Claude Fable 5「静默拒绝」推理策略的观察。

AI Daily Google DiffusionGemma AI Agent Claude Fable 5

2026年6月10日

【AI早读 0610】Claude Fable 5 全平台上线，Gemma 4 12B 开源本地多模态

6 月 9 号是今年最密集的 AI 发布日之一：Anthropic 正式放出前沿模型 Mythos 5 与消费版 Fable 5，强项在超长上下文 agentic coding，但定价翻倍、普通用户感知有限，并同步上架 Google Cloud。Google DeepMind 开源 Gemma 4 12B 无编码器多模态模型，16GB 显存即可本地跑。OpenAI 连发 Codex 企业落地案例，AWS 放出两篇 agent 实践，Cloudflare 分享前沿模型攻击的防御架构。

AI Daily Claude Fable 5 Gemma 4 12B Codex AI Agent

2026年6月8日

【AI早读 0608】Agent 生态加速成熟，多智能体与平台战并进

过去 24 小时 AI 圈关键词是 Agent：Towards Data Science 把 Python 多智能体教程推成中级实践；AI Engineer 频道两场分享指向 Agent 从原型走向规模化 - MCP 管道与 LLM 可观测性；OpenAI 据 FT 报道要把 ChatGPT 重构成集成 Codex 的“超级应用”，内部一句“Chat is dead”；Ramp 数据显示 DeepSeek 登顶增长最快的软件供应商，价格驱动的“Token 经济”成形；Notion 因 Anthropic Opus 4.7/4.8 抖动一度禁用全部 Anthropic 模型；The Algorithmic Bridge 深扒 Anthropic 如何用安全叙事影响特朗普政府的 AI 政策。

AI Daily AI Agent MCP OpenAI Anthropic

2026年6月7日

【AI早读 0607】MCP应用生态与智能体基础设施

今天从 MCP Apps 进入 VS Code 说起，延伸到 AI 开发中的“意图债务”、ChatGPT Lockdown Mode 对 Prompt 注入外泄路径的限制，以及 MicroPython + WASM 轻量代码沙箱等智能体基础设施。

AI Daily MCP AI Agent AI 安全开发工具

2026年6月5日

Codex Sites 不是又一个 Lovable - 它让应用自己把自己运营下去

Greg Isenberg 在播客里用六个 prompt 搭了一个会自己更新的 Startup Ideas 看板，然后说了一句我一直在等的话：build once, let the agent run it。Codex Sites 和 Replit、Lovable 的不同，不在功能多少，而在你把上下文住在哪里 - 以及，谁在你不在的时候继续维护这个应用。

Codex AI Agent AI 编程

2026年6月4日

【AI早读 0604】前沿AI治理与形式验证

OpenAI 同日发布公共政策议程与前沿 AI 民主治理蓝图，系统阐述安全治理立场；Axiom Math 展示 Lean 形式验证带来的证明能力飞跃；AWS 则用 SFT + DPO 优化小模型的 Agent 工具调用。

AI Daily AI 治理 AI 安全形式验证 AI Agent

2026年6月4日

强强联手！把 Codex 接入任何智能体(Claude Code, OpenClaw, Hermes, ...)

Claude Code 写代码、Codex 出图、Hermes 跑研究 - 与其在三个窗口之间来回切换，不如让一个 agent 直接喊另一个上场。聊聊我做的 codex-cli skill：用 `codex exec` 把 Codex CLI 包成一个可装的能力，任何 agent 装上就能委托任务，还能稳定地把 Codex 偷偷藏在 `~/.codex/generated_images/` 下的图找回来。

Codex Agent Skills Claude Code AI Agent

2026年6月3日

【AI早读 0603】Agent 生态全面爆发

微软 Build 2026 上 GitHub 推出 agent-native 桌面应用 Copilot app，COO Kyle Daigle 在 Latent Space 披露 AI agent 推动 commit 量年增 1400%、Actions 用量翻 4 倍；H Company 发布 Holo3.1，首次加入 FP8 / Q4 / NVFP4 量化权重，NVFP4 吞吐量是 BF16 的 1.74 倍，AndroidWorld 得分从 67% 跃至 79.3%；AWS 给出 AgentCore Gateway + OAuth 保护 MCP 服务器的完整教程；Together AI 用 MiniMax Sparse Attention 让 MiniMax-M3 在 1M 上下文上 prefill 提速 9 倍、decode 提速 15 倍；a16z 提出视觉 AI 下一站是生成代码，而非像素。

AI Daily AI Agent GitHub Copilot MCP

2026年6月2日

写 Agent Skill 就是 TDD - 用 subagent 当 test runner

为了让任何 Coding Agent 一行命令就能调用 YourWebs API 发布 HTML 页面，我的 CC 用 Superpowers 的 writing-skills 为我做了一个 yourwebs-skill。这篇想分享的不是结果，是过程 - 写 Skill 跟写代码的 TDD 是同一件事，而那个最关键的 test runner，是一个上下文为零的 subagent。

Agent Skills AI Agent AI 编程

2026年6月1日

【AI早读 0601】AI 安全与智能体攻防

Vercel 拆解了 4 月 12 日他们文档 AI 端点遭遇的推理窃取攻击 - 流量飙到 10 倍峰值，攻击者用住宅代理 + OpenAI 兼容适配器把企业 API 转卖；PromptArmor 发现 ChatGPT for Google Sheets 插件可通过提示词注入把整个 Drive 工作簿外传；SafeIntelligence 提出 Spec-Driven Testing - 把测试焦点从输出一致性转向行为规格匹配；Together AI 聊了语音 Agent 工程化的延迟/质量/规模三难；G7 首次在声明里就开源 AI 与开放权重 AI 的术语达成共识。

AI Daily Security AI Agent Vercel 语音 Agent

2026年5月31日

【AI早读 0531】Anthropic 把 Claude「关在笼子里」的安全设计

Anthropic 公开了三条产品线的 Agent 隔离方案 - claude.ai 用 gVisor、Claude Code 用 Seatbelt/Bubblewrap、Cowork 用全 VM；Claude Code 早期 93% 的批准率反而成为安全风险，被 auto mode + 架构改造替代；AI Engineer 大会上「砍掉 95% Agent 技能反而更好」成为新共识；SoftBank €750 亿建法国数据中心，OpenRouter 完成 $1.13 亿 B 轮。

AI Daily Anthropic AI Agent Sandbox Agent Skills

2026年5月28日

【AI早读 0528】智能体评测与进化

ITBench-AA 显示所有前沿模型在企业级 IT 智能体任务上均低于 50%；OpenAI 与 Thrive 的 Tax AI 案例展示了 Codex 如何把生产纠错变成自改进循环；Warp 用 GPT-5.5 推动开源智能体开发；Alignment Forum 讨论评测博弈与 AI 研发自动化。

AI Daily AI Agent Codex

2026年5月27日

【AI早读 0527】Agent安全

今天围绕 Agent 安全与运行基础设施展开：Copilot Cowork 被披露可通过间接 Prompt 注入外泄文件；AWS 从 AgentWatch、AgentCore Memory 到多 Agent 运行时持续补齐平台能力；Agent Gravity 则提出一个关键问题：未来究竟由谁来运行你的 Agent？

AI Daily AI Agent AI 安全 Prompt 注入 AWS

2026年5月27日

Greg Isenberg 硅谷观察 - SaaS 没死，但亿万富翁正在批量收购、压缩岗位、用 agent 重写

SaaS 没死，但亿万富翁正在批量把它们买下来、压缩岗位、按 agent-first 重写、然后提价。MCP 成了新的 SEO；模型忠诚度死了；forward-deployed engineer 是 SF 现在最热的岗位；agent debt 已经是真实的工程问题。这些是 Greg Isenberg 刚结束在旧金山 5 天后，在 X 上写下的 17 条 takeaway，我把它完整翻译过来。

AI Agent MCP AI 创业

2026年5月26日

【AI早读 0526】Addy Osmani 提出「你才是编排税」，Hugging Face 重新区分 Model / Scaffolding / Harness / Agent

Addy Osmani 用 Python GIL 比喻揭穿多 agent 并发的真正瓶颈 - 是开发者本人；Hugging Face 发出官方词汇表，把 Model / Scaffolding / Harness / Agent 这四个被混用的概念锚定下来；Google DeepMind 的 Nicholas Kang 与 Michael Aaron 分享大规模 agent 评估的工程化做法；Bounded Autonomy 把「自由意志 vs 确定性」落到 harness 工程里；Simon Willison 发布 datasette 1.0a30 的可扩展 Jump 菜单 + datasette-agent 联动。

AI Daily AI Agent Agent Skills

2026年5月26日

腾讯开源 TencentDB Agent Memory：给 OpenClaw 和 Hermes Agent 接上 4 层本地长期记忆

腾讯 4 月初放出 TencentDB Agent Memory，7 周攒下 4.1K stars。它的思路有点反潮流 - 不再把对话历史塞进扁平向量库，而是建一座 L0 Conversation → L1 Atom → L2 Scenario → L3 Persona 的语义金字塔；短期任务状态再用 Mermaid 符号图替代工具日志。已经支持 OpenClaw 插件和 Hermes Agent 镜像，在 PersonaMem 上把准确率从 48% 拉到 76%，WideSearch 上 token 消耗砍掉 61%。这篇拆开看它的两根支柱、两条集成路径，和几段值得抄走的工程实现。

AI Agent Agent Memory OpenClaw Hermes Agent Tencent

2026年5月25日

【AI早读 0525】DeepMind 把多 agent 编排做成系统工程，Microsoft Webwright 在 Odysseys 跑出 60.1%

Google DeepMind 的 KP Sawhney 和 Ian Ballantyne 公开了大规模 agent 编排的生产实践 - 拆模块、轻量调度器、可观测性是三件事；Callosum 提出异构智能编排把人类 + 传统系统 + AI 放进同一管线；Michael Richman 提醒 FOMAT 是行业新焦虑；Armin Ronacher 一条吐槽戳中 AI 中介改写 issue 这个坏习惯。快讯：Microsoft Webwright、DeepSeek 永久 75% 降价、Hassabis 与 LeCun 公开互怼。

AI Daily AI Agent DeepMind

2026年5月25日

Andrej Karpathy 的一条推，炸出来一个 149K Stars 的 Agent Skill

一月底 Karpathy 在 X 上的一条随手推三天内被高频转发，社区配套写的一份 `CLAUDE.md`（`multica-ai/andrej-karpathy-skills`）3 个月攒下 149K stars、28 天霸占 GitHub trending 第一。把 Karpathy 给 LLM 总结的 3 个老毛病和这份仓库的 4 条规则对着拆，看怎么贴进项目根目录、看哪几个信号判断它真的生效。

Claude Code CLAUDE.md AI Agent AI 编程 Karpathy

2026年5月23日

【AI早读 0523】Gartner 钦点 Codex 与 GitHub Copilot 为 Leader，Dharma 3B 模型成本五十分之一反超 GPT-4o

Gartner 发布首份《企业级 AI 编程智能体魔力象限》，OpenAI Codex 与 GitHub Copilot 双双入 Leader；Dharma AI 用 3B 参数的 DharmaOCR 以约 1/50 推理成本反超 GPT-4o、Claude 3.5 等前沿 API；Tomasz Tunguz 提出「Plastic UI」概念。

AI Daily AI Agent

2026年5月22日

【AI早读 0522】OpenAI 攻克 Erdős 猜想，AWS、SageMaker、Microsoft 智能体齐发

OpenAI 推理模型用不到 $1000 的算力推翻一个悬置 80 年的 Erdős 猜想；AWS 同一天密集发布 6+ 篇 Bedrock AgentCore 技术博客，SageMaker 推出 OpenAI 兼容 API - 推理能力进化与智能体基建定型并行。

AI Daily AI Agent

2026年5月20日

【AI早读 0520】Karpathy入Anthropic，Google I/O Gemini 3.5登场

两个大事件撞在同一天 - Andrej Karpathy 加入 Anthropic 主攻预训练，Google I/O 2026 发布 Gemini 3.5 Flash；外加 Claude Managed Agents 上线 Cloudflare、AWS 推出 Programmatic Tool Calling。

AI Daily AI Agent

2026年5月19日

【AI早读 0519】Agent评估到部署，以及长时任务智能体的稳定性

今天聚焦 Agent 从评估到部署 - IBM 跨场景排行榜、OpenAI×Dell 把 Codex 推进企业本地环境、Anthropic 谈长时任务稳定性，以及一份系统的 Agent 评估指南。

AI Daily AI Agent Codex

2026年5月15日

a16z观点：SaaS 的入口正在从数据库挪到推理层

a16z 这周发了一篇观点文章 - From System of Record to System of Intelligence。同一天 Notion 把工作区改造成 AI agent hub。两件事放一起看，是 SaaS 产品形态的一次方向调整 - 入口正在从“我帮你把数据存好”挪到“我帮你拉所有上下文做事”。

AI Agent SaaS 工作流

2026年5月13日

Agent 输出 HTML 的时代到了

Anthropic 工程师 Thariq Shihipar 5 月初发了一条“HTML is the new markdown”，附了 20 个由 Claude Code 产出的单文件 HTML 示例。Simon Willison 第二天宣布放弃用了三年的 Markdown 默认值。这件事值得跟一跟 - 不是 HTML 全面胜出，而是 agent 输出三年前和现在已经是两回事。

AI Agent Claude Code Agent Skills HTML

2026年5月9日

Cloudflare 给 agent 发了张能刷的卡

Cloudflare 这周让 agent 能自己开账号、注册域名、付费、部署。听起来像把控制权交了出去，但其实没有 - 它把控制点从 agent 的执行边缘挪到了协议层。这是个完全不一样的 agent 安全哲学，也是把 agent 当成 first-class 客户类别的开始。

AI Agent Cloudflare Agent Safety Stripe MCP

2026年5月7日

Cloudflare 一周拆了 Agent 的两堵墙：Code Mode MCP 与 Agent Memory

Code Mode MCP 把 1.17M tokens 的 API 压成 1K，Agent Memory 把对话历史压成可索引的结构化记忆。两个公告分开看是产品发布，放一起看是同一个判断 - agent 跑不动了，得重新设计存储层。

Cloudflare MCP AI Agent Agent Memory Context Engineering

2026年5月7日

OpenAI 今天的语音三连发：voice agent 终于可以做事

GPT-Realtime-2 把 GPT-5 的推理塞进语音，Translate 把同传打到 $0.034 一分钟，Whisper 做流式 STT，外加重写的 WebRTC 跑在 Cloudflare 边缘上。拼起来是一句话 - voice agent 终于可以做事，不只是聊天。

OpenAI Voice AI Realtime API AI Agent GPT-Realtime

2026年4月27日

Agent 框架的上下文管理：四种实现，殊途同归

Pi、OpenClaw、Claude Code、Letta 在文件读取、会话压缩、子 Agent 隔离上做了不同的选择，但仔细比对会发现，它们正在收敛到同一套设计模式。Arize 创始人 Aparna Dhinakaran 把四个代码库摊在一起做了对照。

AI AI Agent Context Engineering Claude Code Letta

2026年4月4日

Paperclip 实战：一个人搭一个 AI 公司，从安装到跑起来

一行命令装好，CEO 自己招了 CTO，CTO 自己领了任务，16 个 Issue 自动生成。全程 $0 费用。这是我用 Paperclip 搭建 AI Agent 团队的完整记录。

AI Paperclip AI Agent 开源

2026年4月3日

AI Agent 框架对比：LangChain vs CrewAI vs AutoGen vs OpenClaw

四个主流 AI Agent 框架的真实使用体验对比。不吹不黑，说说各自的优缺点和适用场景。

AI Agent LangChain 框架开发工具

2026年3月29日

用飞书 CLI + AI Agent 搭了个 A 股投资助手

飞书命令行工具刚开源，我拿它配合 Claude Code 搭了个 A 股每日跟踪系统：多维表格管理持仓、自动抓取行情数据、一句话创建盘中提醒。从安装到跑通，全程自然语言驱动。

飞书 CLI AI Agent Claude Code

2026年3月20日

Claude Code 现在可以用 Telegram 遥控了

Anthropic 刚发布了 Claude Code Channels，让你通过 Telegram 远程操控 Claude Code。手机发条消息，它就在你电脑上干活。这篇讲清楚它是什么、怎么配、能干嘛。

Claude Code Telegram AI Agent MCP

2026年3月12日

OpenClaw 龙虾市集：大厂排队取餐，创始人买单

百度在公司楼下办了个龙虾市集帮人装 OpenClaw，腾讯爬光了 ClawHub 做了个 SkillHub。创始人 steipete 说：你们吃得很开心，账单能看一眼吗？

OpenClaw 开源 AI Agent

2026年3月6日

MCP Apps：让 AI 对话里长出交互界面

MCP 工具一直只能返回文本。现在 MCP Apps 让工具可以返回完整的交互式界面 - 表单、仪表盘、3D 模型、实时监控 - 直接嵌在对话里。这是 MCP 协议最重要的一次扩展。

MCP MCP Apps AI Agent 交互界面

2026年2月27日

Claude Code 的记忆机制：从 CLAUDE.md 到 Auto Memory，它到底记住了什么？

Claude Code 刚上线了 Auto Memory 功能。加上原有的 CLAUDE.md 体系，它现在有六层记忆结构。这篇拆解每层的用途、加载时机，以及怎么用才不会变成负担。

Claude Code AI Agent 开发工具

2026年2月27日

Docker Sandbox：给 AI Agent 造了个金库级的隔离环境，但你真的需要吗？

Docker 去年底推出了 Sandbox，用 microVM 隔离 AI Agent，API Key 通过网络代理注入，Agent 本身拿不到密钥。核心解决的是信任边界问题 - 你不完全信任 Agent 时才需要它。

Docker AI Agent 安全 Sandbox

2026年2月24日

一条命令跑起来：用 Ollama 运行 OpenClaw 个人 AI 助手

Ollama 0.17 新增 launch 命令，一行搞定 OpenClaw 的安装、配置和启动。开放模型跑个人 AI 助手从没这么简单过。

Ollama OpenClaw AI Agent 开放模型

2026年2月21日

Cloudflare 的 Code Mode：用两个工具替代 2500 个端点

当 API 有 2500 个端点时，传统 MCP 方案要吃掉 117 万 token。Cloudflare 的 Code Mode 只用两个工具把这个数字压到 1000。背后的思路比技术本身更值得看。

MCP Cloudflare AI Agent API

2026年2月17日

Next.js 正在为 AI Agent 重新设计自己

Next.js 团队发布了一篇博客，讲述他们如何从 Agent 的视角重新思考框架设计。从一个被放弃的浏览器内 Agent，到 MCP 集成，再到 agents.md - 这篇是我的阅读笔记。

Next.js AI Agent MCP 开发工具

2026年2月12日

在 Telegram 里掌控 OpenClaw 上下文 - 这些命令你该知道

系统提示词占了多少 token？工具定义有多大？发个 /context 就知道了。

OpenClaw Telegram AI Agent Context Engineering

2026年2月9日

给 Agent 加定时任务？七个你一定会踩的坑

从 OpenClaw 一次关掉 60+ cron issues 的重构中，提炼出 Agent 定时任务系统的七个可靠性教训：亚秒精度陷阱、LLM 调用必须有超时、失败退避不能省、单次任务的死循环、投递上下文会过期、重复管道要合并、以及 —— 不是所有模型都会按你的 schema 传参。

AI AI Agent Cron 可靠性 OpenClaw

2026年2月6日

Claude Code Hooks 实战：实时感知会话状态的绝佳机制

深入 Claude Code Hooks 机制：配置格式、事件生命周期、三种钩子类型，以及一个真实案例 - 如何用 Hooks 驱动桌面宠物实时反映 AI 编码状态。

Claude Code Hooks AI Agent Electron

2026年2月6日

OpenCode 的 Hooks 机制：事件总线、插件钩子与配置钩子

深入 OpenCode 源码，解析其三层 Hooks 架构：类型安全的事件总线、插件生命周期钩子、以及配置驱动的实验性钩子。理解编码智能体如何在松耦合的前提下实现精确的行为控制。

OpenCode Hooks AI Agent 架构分析事件驱动

2026年2月5日

OpenClaw 的灵魂设计：SOUL.md 如何让 AI Agent 拥有人格

深入解析 OpenClaw 的创新设计 SOUL.md —— 一个让 AI Agent 拥有人格、边界和灵魂的文件系统，以及它背后的哲学思考。

AI AI Agent OpenClaw Persona SOUL.md

2026年2月4日

OpenClaw 提示词工程大赏：如何让 AI Agent 更聪明地工作

通过源码分析，揭示 OpenClaw 如何通过模块化提示词架构、动态上下文注入、安全护栏和行为引导，让 AI Agent 更高效、更智能地完成复杂任务。

AI Prompt Engineering AI Agent OpenClaw 系统设计

2026年2月2日

深入解析 OpenClaw 多智能体架构：为什么它比 Claude Code 更强大

通过源码分析，详解 OpenClaw 如何实现多智能体协作、动态提示词构建、工具系统和长时任务执行，揭示其超越 Claude Code 的技术秘密。

AI AI Agent OpenClaw 架构分析

2026年1月20日

Agent 开发的核心挑战：如何从海量 Traces 中发现问题

LangChain 创始人 Harrison Chase 的文章：Agent 不是传统软件，你无法预测它在生产环境中的行为。当每天产生 10 万条 Traces 时，传统分析方法的局限性就显现出来了。

LangChain LangSmith AI Agent 可观测性生产环境

2025年1月31日

Pydantic AI：构建 Agentic LLM 应用程序的类型安全 AI Agent 框架

Pydantic AI：构建 Agentic LLM 应用程序的类型安全 AI Agent 框架。随着 Pydantic AI v0.0.21 的最新发布，该框架带来了大量新特性和改进，在 AI 开发社区获得了重要关注。

AI AI Agent PydanticAI

AI Agent

【AI早读 0620】AI Agent 重塑软件生命周期

【AI早读0619】GLM-5.2登顶开源，智能体安全框架密集发布

【AI早读 0617】模拟部署预测模型安全，OpenAI 发布 Deployment Simulation

【AI早读 0616】Agent 故障诊断与深度代理架构

【AI早读 0613】智能体主动性飞跃与模型评估新范式

【AI早读0612】OpenAI收购Ona为Codex构建持久化Agent执行环境

【AI早读 0611】Google AI 三连发：DiffusionGemma、Managed Agents 与 ML 遗忘审计

【AI早读 0610】Claude Fable 5 全平台上线，Gemma 4 12B 开源本地多模态

【AI早读 0608】Agent 生态加速成熟，多智能体与平台战并进

【AI早读 0607】MCP应用生态与智能体基础设施

Codex Sites 不是又一个 Lovable - 它让应用自己把自己运营下去

【AI早读 0604】前沿AI治理与形式验证

强强联手！把 Codex 接入任何智能体(Claude Code, OpenClaw, Hermes, ...)

【AI早读 0603】Agent 生态全面爆发

写 Agent Skill 就是 TDD - 用 subagent 当 test runner

【AI早读 0601】AI 安全与智能体攻防

【AI早读 0531】Anthropic 把 Claude「关在笼子里」的安全设计

【AI早读 0528】智能体评测与进化

【AI早读 0527】Agent安全

Greg Isenberg 硅谷观察 - SaaS 没死，但亿万富翁正在批量收购、压缩岗位、用 agent 重写

【AI早读 0526】Addy Osmani 提出「你才是编排税」，Hugging Face 重新区分 Model / Scaffolding / Harness / Agent

腾讯开源 TencentDB Agent Memory：给 OpenClaw 和 Hermes Agent 接上 4 层本地长期记忆

【AI早读 0525】DeepMind 把多 agent 编排做成系统工程，Microsoft Webwright 在 Odysseys 跑出 60.1%

Andrej Karpathy 的一条推，炸出来一个 149K Stars 的 Agent Skill

【AI早读 0523】Gartner 钦点 Codex 与 GitHub Copilot 为 Leader，Dharma 3B 模型成本五十分之一反超 GPT-4o

【AI早读 0522】OpenAI 攻克 Erdős 猜想，AWS、SageMaker、Microsoft 智能体齐发

【AI早读 0520】Karpathy入Anthropic，Google I/O Gemini 3.5登场

【AI早读 0519】Agent评估到部署，以及长时任务智能体的稳定性

a16z观点：SaaS 的入口正在从数据库挪到推理层

Agent 输出 HTML 的时代到了

Cloudflare 给 agent 发了张能刷的卡

Cloudflare 一周拆了 Agent 的两堵墙：Code Mode MCP 与 Agent Memory

OpenAI 今天的语音三连发：voice agent 终于可以做事

Agent 框架的上下文管理：四种实现，殊途同归

Paperclip 实战：一个人搭一个 AI 公司，从安装到跑起来

AI Agent 框架对比：LangChain vs CrewAI vs AutoGen vs OpenClaw

用飞书 CLI + AI Agent 搭了个 A 股投资助手

Claude Code 现在可以用 Telegram 遥控了

OpenClaw 龙虾市集：大厂排队取餐，创始人买单

MCP Apps：让 AI 对话里长出交互界面

Claude Code 的记忆机制：从 CLAUDE.md 到 Auto Memory，它到底记住了什么？

Docker Sandbox：给 AI Agent 造了个金库级的隔离环境，但你真的需要吗？

一条命令跑起来：用 Ollama 运行 OpenClaw 个人 AI 助手

Cloudflare 的 Code Mode：用两个工具替代 2500 个端点

Next.js 正在为 AI Agent 重新设计自己

在 Telegram 里掌控 OpenClaw 上下文 - 这些命令你该知道

给 Agent 加定时任务？七个你一定会踩的坑

Claude Code Hooks 实战：实时感知会话状态的绝佳机制

OpenCode 的 Hooks 机制：事件总线、插件钩子与配置钩子

OpenClaw 的灵魂设计：SOUL.md 如何让 AI Agent 拥有人格

OpenClaw 提示词工程大赏：如何让 AI Agent 更聪明地工作

深入解析 OpenClaw 多智能体架构：为什么它比 Claude Code 更强大

Agent 开发的核心挑战：如何从海量 Traces 中发现问题

Pydantic AI：构建 Agentic LLM 应用程序的类型安全 AI Agent 框架