新课程LangChain智能体开发
Very Small Woods

打造克制、好用的 AI 产品。

分享实用 AI、轻巧工具和创作型工作流。

博客

最新文章

查看全部

2026年6月1日

【AI早读 0601】AI 安全与智能体攻防

Vercel 拆解了 4 月 12 日他们文档 AI 端点遭遇的推理窃取攻击 - 流量飙到 10 倍峰值,攻击者用住宅代理 + OpenAI 兼容适配器把企业 API 转卖;PromptArmor 发现 ChatGPT for Google Sheets 插件可通过提示词注入把整个 Drive 工作簿外传;SafeIntelligence 提出 Spec-Driven Testing - 把测试焦点从输出一致性转向行为规格匹配;Together AI 聊了语音 Agent 工程化的延迟/质量/规模三难;G7 首次在声明里就开源 AI 与开放权重 AI 的术语达成共识。

AI DailySecurityAI AgentVercel
阅读全文 →

2026年5月31日

【AI早读 0531】Anthropic 把 Claude「关在笼子里」的安全设计

Anthropic 公开了三条产品线的 Agent 隔离方案 - claude.ai 用 gVisor、Claude Code 用 Seatbelt/Bubblewrap、Cowork 用全 VM;Claude Code 早期 93% 的批准率反而成为安全风险,被 auto mode + 架构改造替代;AI Engineer 大会上「砍掉 95% Agent 技能反而更好」成为新共识;SoftBank €750 亿建法国数据中心,OpenRouter 完成 $1.13 亿 B 轮。

AI DailyAnthropicAI Agent

2026年5月29日

【AI早读 0529】Anthropic 一日三发 - Opus 4.8、$965B、Mythos

5 月 28 日 Anthropic 同日完成三项发布 - Claude Opus 4.8 上线,SWE-bench Pro 提升 4.9pp、Terminal-Bench 2.1 提升 8.5pp,Honesty 成为第一特性,对齐质量逼近 Mythos;650 亿美元 Series H 把估值推到 9650 亿,超过 OpenAI;Mythos 将在数周内向全量客户开放。

AI DailyAnthropicClaude

2026年5月28日

【AI早读 0528】智能体评测与进化

ITBench-AA 显示所有前沿模型在企业级 IT 智能体任务上均低于 50%;OpenAI 与 Thrive 的 Tax AI 案例展示了 Codex 如何把生产纠错变成自改进循环;Warp 用 GPT-5.5 推动开源智能体开发;Alignment Forum 讨论评测博弈与 AI 研发自动化。

AI DailyAI AgentCodex

2026年5月27日

Greg Isenberg 硅谷观察 - SaaS 没死,但亿万富翁正在批量收购、压缩岗位、用 agent 重写

SaaS 没死,但亿万富翁正在批量把它们买下来、压缩岗位、按 agent-first 重写、然后提价。MCP 成了新的 SEO;模型忠诚度死了;forward-deployed engineer 是 SF 现在最热的岗位;agent debt 已经是真实的工程问题。这些是 Greg Isenberg 刚结束在旧金山 5 天后,在 X 上写下的 17 条 takeaway,我把它完整翻译过来。

AI AgentMCPAI 创业

合作伙伴

CompeteMap — 英国及爱尔兰学生竞赛一站式搜索

数学、编程、科学、写作等各类竞赛信息汇总,支持按年龄和科目筛选,再也不错过报名截止日。

视频

最新视频

订阅频道

B站

五里墩茶社

更多中文视频内容与课程

访问空间

产品

产品与服务

查看全部

最近一封 · Sample

【AI早读 0601】AI 安全与智能体攻防

Vercel 拆解了 4 月 12 日他们文档 AI 端点遭遇的推理窃取攻击 - 流量飙到 10 倍峰值,攻击者用住宅代理 + OpenAI 兼容适配器把企业 API 转卖;PromptArmor 发现 ChatGPT for Google Sheets 插件可通过提示词注入把整个 Drive 工作簿外传;SafeIntelligence 提出 Spec-Driven Testing - 把测试焦点从输出一致性转向行为规格匹配;Together AI 聊了语音 Agent 工程化的延迟/质量/规模三难;G7 首次在声明里就开源 AI 与开放权重 AI 的术语达成共识。

—— william

Letters

来信

里面装的是

  • 新文章 — 写完一篇就寄一封,不攒货
  • 这周读到的、看到的、好用的工具
  • 正在折腾的实验,附带翻车记录

约莫 1–2 周一封 · 随时退订