模型训练

共 2 篇文章

2026年6月15日

【AI早读 0615】安全对齐与WASM生态

Google DeepMind 解释为什么简单过滤 SFT 数据难以消除安全相关行为，关键可能在教师模型回答的行为迁移；Pyodide 开始支持把 WASM wheels 直接发布到 PyPI；GPU 时间分片则为 Kubernetes 上并发运行多个 LLM Agent 提供工程路径。

2026年5月16日

今天聚焦 LLM 架构、预训练稳定性和 AI 学习边界：Sebastian Raschka 梳理长上下文效率相关的新架构，Dwarkesh Patel 总结打破因果性与引入偏置如何导致训练失败，同时讨论强化学习与人类学习之间不能被忽视的差异。