博客

写作与笔记

记录 AI 系统、产品思考与创作者工作流的实践。

2026年6月21日

【AI早读 0621】透明度与人才流动：Google 给扩散模型做解剖，AlphaFold 之父投奔 Anthropic

Google DeepMind 对 DiffusionGemma 展开透明度审计，发现扩散语言模型的中间变量仍可解释，但非时序推理让算法透明度更具挑战；AlphaFold 创造者 John Jumper 离开 DeepMind 加入 Anthropic；Codex 则新增从一次操作演示中学习并重复执行工作流的能力。

AI Daily LLM AI 安全 Anthropic Codex

2026年6月20日

【AI早读 0620】AI Agent 重塑软件生命周期

Google 的新软件生命周期白皮书把 Agent 定义为“模型加 harness”，强调 Context Engineering、验证和渐进式披露；多篇实践进一步展示 Agent 如何从写代码延伸到部署、数据分析、信息检索和云平台运维。

AI Daily AI Agent 软件工程开发工具云平台

2026年6月19日

【AI早读0619】GLM-5.2登顶开源，智能体安全框架密集发布

GLM-5.2 以 753B MoE、百万 token 上下文和 IndexShare 稀疏注意力机制登顶开放权重模型；Google DeepMind 发布 AI Control 路线图，Amazon Bedrock AgentCore 正式 GA，智能体安全与运行基础设施同步加速。

AI Daily GLM-5.2 LLM AI 安全 AI Agent

2026年6月17日

【AI早读 0617】模拟部署预测模型安全，OpenAI 发布 Deployment Simulation

OpenAI 发布 Deployment Simulation，用真实对话分布模拟新模型上线后的行为，在发布前预测安全风险；Martin Fowler 网站则通过 Bayer 的 PRINCE 案例，总结 Context Discipline 与 Harness Engineering 如何提升 Agentic RAG 系统可靠性。

AI Daily OpenAI AI 安全 AI Agent RAG

2026年6月16日

今天三篇 AWS importance 5 的博客串成一条线：Strands Evals SDK 用 Detector 自动分析 Agent 的执行轨迹，给出故障分类、因果链和具体修复建议，把“诊断瓶颈”从人工压成自动化；LangChain Deep Agents + Bedrock AgentCore 用“委派 - 隔离 - 汇总”的子 Agent 架构构建研究代理，每个子 Agent 跑在自己的 MicroVM 里；Google DeepMind 的 Gemma 4 系列正式登陆 Amazon Bedrock，主打 intelligence-per-parameter。

AI Daily AI Agent AWS Gemma 4 Agents SDK

2026年6月15日

【AI早读 0615】安全对齐与WASM生态

Google DeepMind 解释为什么简单过滤 SFT 数据难以消除安全相关行为，关键可能在教师模型回答的行为迁移；Pyodide 开始支持把 WASM wheels 直接发布到 PyPI；GPU 时间分片则为 Kubernetes 上并发运行多个 LLM Agent 提供工程路径。

AI Daily AI 安全模型训练 WASM 开发工具

2026年6月14日

【AI早读 0614】美国政府紧急封禁 Anthropic 最强模型

美国政府援引国家安全权力，要求 Anthropic 暂停外国国民访问 Fable 5 与 Mythos 5；与此同时，Microsoft SkillOpt 展示如何像训练模型权重一样迭代优化 Markdown skill，GLM-5.2 等新进展也在继续推动模型能力边界。

AI Daily Anthropic AI 安全 Agent Skills GLM-5.2

2026年6月13日

【AI早读 0613】智能体主动性飞跃与模型评估新范式

今天聚焦智能体的两个方向加一个底层动向：Simon Willison 记录 Claude Fable 5 的“relentlessly proactive” —— 为查一个滚动条 bug 自主注入代码、自写诊断 HTTP 服务、跨浏览器截图验证，是有意图的多步自纠探索；Google DeepMind 提出“模型 diffing”新范式，让审计智能体自主构造 prompt 主动搜索两个模型的行为差异；Google Cloud 发布 Open Knowledge Format，用带 YAML frontmatter 的 Markdown 为 AI 的结构化知识建开放标准。能力、评估、基础设施三条线正拼成智能体开发的完整图景。

AI Daily AI Agent Claude Fable 5 模型评估 Google

主题簇

从主题进入内容

查看全部标签

AI Agent54 篇

最新更新

【AI早读 0620】AI Agent 重塑软件生命周期

AI Daily30 篇

AI29 篇

最新更新

Agent 框架的上下文管理：四种实现，殊途同归

MCP24 篇

最新更新

【AI早读 0608】Agent 生态加速成熟，多智能体与平台战并进

Claude Code16 篇

开发工具15 篇

最新更新

【AI早读 0620】AI Agent 重塑软件生命周期

最近一封 · Sample

【AI早读 0621】透明度与人才流动：Google 给扩散模型做解剖，AlphaFold 之父投奔 Anthropic

“Google DeepMind 对 DiffusionGemma 展开透明度审计，发现扩散语言模型的中间变量仍可解释，但非时序推理让算法透明度更具挑战；AlphaFold 创造者 John Jumper 离开 DeepMind 加入 Anthropic；Codex 则新增从一次操作演示中学习并重复执行工作流的能力。”

—— william

Letters

来信

里面装的是

新文章 — 写完一篇就寄一封，不攒货
这周读到的、看到的、好用的工具
正在折腾的实验，附带翻车记录

约莫 1–2 周一封 · 随时退订

写作与笔记

【AI早读 0621】透明度与人才流动：Google 给扩散模型做解剖，AlphaFold 之父投奔 Anthropic

【AI早读 0620】AI Agent 重塑软件生命周期

【AI早读0619】GLM-5.2登顶开源，智能体安全框架密集发布

【AI早读 0617】模拟部署预测模型安全，OpenAI 发布 Deployment Simulation

【AI早读 0616】Agent 故障诊断与深度代理架构

【AI早读 0615】安全对齐与WASM生态

【AI早读 0614】美国政府紧急封禁 Anthropic 最强模型

【AI早读 0613】智能体主动性飞跃与模型评估新范式

从主题进入内容

【AI早读 0621】透明度与人才流动：Google 给扩散模型做解剖，AlphaFold 之父投奔 Anthropic

来信