2026年6月15日
【AI早读 0615】安全对齐与WASM生态
Google DeepMind 解释为什么简单过滤 SFT 数据难以消除安全相关行为,关键可能在教师模型回答的行为迁移;Pyodide 开始支持把 WASM wheels 直接发布到 PyPI;GPU 时间分片则为 Kubernetes 上并发运行多个 LLM Agent 提供工程路径。
2026年6月15日
Google DeepMind 解释为什么简单过滤 SFT 数据难以消除安全相关行为,关键可能在教师模型回答的行为迁移;Pyodide 开始支持把 WASM wheels 直接发布到 PyPI;GPU 时间分片则为 Kubernetes 上并发运行多个 LLM Agent 提供工程路径。
2026年5月16日
今天聚焦 LLM 架构、预训练稳定性和 AI 学习边界:Sebastian Raschka 梳理长上下文效率相关的新架构,Dwarkesh Patel 总结打破因果性与引入偏置如何导致训练失败,同时讨论强化学习与人类学习之间不能被忽视的差异。