2026年6月5日
Codex Sites 不是又一个 Lovable - 它让应用自己把自己运营下去
Greg Isenberg 在播客里用六个 prompt 搭了一个会自己更新的 Startup Ideas 看板,然后说了一句我一直在等的话:build once, let the agent run it。Codex Sites 和 Replit、Lovable 的不同,不在功能多少,而在你把上下文住在哪里 - 以及,谁在你不在的时候继续维护这个应用。
博客
记录 AI 系统、产品思考与创作者工作流的实践。
2026年6月5日
Greg Isenberg 在播客里用六个 prompt 搭了一个会自己更新的 Startup Ideas 看板,然后说了一句我一直在等的话:build once, let the agent run it。Codex Sites 和 Replit、Lovable 的不同,不在功能多少,而在你把上下文住在哪里 - 以及,谁在你不在的时候继续维护这个应用。
2026年6月4日
OpenAI 同日发布公共政策议程与前沿 AI 民主治理蓝图,系统阐述安全治理立场;Axiom Math 展示 Lean 形式验证带来的证明能力飞跃;AWS 则用 SFT + DPO 优化小模型的 Agent 工具调用。
2026年6月4日
Claude Code 写代码、Codex 出图、Hermes 跑研究 - 与其在三个窗口之间来回切换,不如让一个 agent 直接喊另一个上场。聊聊我做的 codex-cli skill:用 `codex exec` 把 Codex CLI 包成一个可装的能力,任何 agent 装上就能委托任务,还能稳定地把 Codex 偷偷藏在 `~/.codex/generated_images/` 下的图找回来。
2026年6月3日
微软 Build 2026 上 GitHub 推出 agent-native 桌面应用 Copilot app,COO Kyle Daigle 在 Latent Space 披露 AI agent 推动 commit 量年增 1400%、Actions 用量翻 4 倍;H Company 发布 Holo3.1,首次加入 FP8 / Q4 / NVFP4 量化权重,NVFP4 吞吐量是 BF16 的 1.74 倍,AndroidWorld 得分从 67% 跃至 79.3%;AWS 给出 AgentCore Gateway + OAuth 保护 MCP 服务器的完整教程;Together AI 用 MiniMax Sparse Attention 让 MiniMax-M3 在 1M 上下文上 prefill 提速 9 倍、decode 提速 15 倍;a16z 提出视觉 AI 下一站是生成代码,而非像素。
2026年6月3日
Agent skill 越用越多,重现性和防篡改怎么解决?聊聊 skills-lock.json 在我项目里的实际用法。
2026年6月2日
OpenAI 前沿模型 GPT-5.5 / GPT-5.4 / Codex 正式入驻 AWS Bedrock,定价与第一方一致;AgentCore Gateway 把 MCP prompts 和 resources 升级为第一类原生对象,新增 elicitation 与 OAuth 2.0 on-behalf-of token 交换;AWS 同步发了 AgentOps 四支柱方法论;Philipp Schmid 给出 Gemini Managed Agents 实战指南;TDS 长文拆解 RAG 检索的可预测失败模式;Jack Clark 引用 UVA / Anthropic / 加拿大央行的论文,称质量调整后美国 AI 经济 2025 年增速约 2600%。
2026年6月2日
为了让任何 Coding Agent 一行命令就能调用 YourWebs API 发布 HTML 页面,我的 CC 用 Superpowers 的 writing-skills 为我做了一个 yourwebs-skill。这篇想分享的不是结果,是过程 - 写 Skill 跟写代码的 TDD 是同一件事,而那个最关键的 test runner,是一个上下文为零的 subagent。
2026年6月1日
Vercel 拆解了 4 月 12 日他们文档 AI 端点遭遇的推理窃取攻击 - 流量飙到 10 倍峰值,攻击者用住宅代理 + OpenAI 兼容适配器把企业 API 转卖;PromptArmor 发现 ChatGPT for Google Sheets 插件可通过提示词注入把整个 Drive 工作簿外传;SafeIntelligence 提出 Spec-Driven Testing - 把测试焦点从输出一致性转向行为规格匹配;Together AI 聊了语音 Agent 工程化的延迟/质量/规模三难;G7 首次在声明里就开源 AI 与开放权重 AI 的术语达成共识。