2026年5月19日
【AI早读 0519】Agent评估到部署,以及长时任务智能体的稳定性
今天聚焦 Agent 从评估到部署 - IBM 跨场景排行榜、OpenAI×Dell 把 Codex 推进企业本地环境、Anthropic 谈长时任务稳定性,以及一份系统的 Agent 评估指南。
2026年5月19日
今天聚焦 Agent 从评估到部署 - IBM 跨场景排行榜、OpenAI×Dell 把 Codex 推进企业本地环境、Anthropic 谈长时任务稳定性,以及一份系统的 Agent 评估指南。
2026年5月14日
Fantasy Premier League 每周一次决策,每次都要看一堆分散在不同网站上的数据:球员状态、对手赛程难度、转会成本、队长候选人。我把这套工作流整理成了一个 skill,叫 fpl-copilot - 数据本地 SQLite,阵容用 Markdown 文件持久化,每个 GW 的分析输出成自包含的 HTML 报告。Claude Code 和 Codex 都能装。
2026年3月24日
OpenAI 开源了 Codex CLI,一个跑在终端里的 AI 编程助手。这篇讲清楚怎么装、怎么登录、怎么用,以及它跟 Claude Code 的区别。
2026年1月8日
Skills 火了,但散落在 GitHub 各处。SkillsMP.com 聚合了 5 万+ Agent Skills,支持分类浏览和语义搜索,Claude Code 和 Codex CLI 通用。
2025年12月26日
OpenAI Codex 通过 Skills 扩展任务能力。一个 Skill 就是包含指令的文件夹,Codex 可以显式调用或自动激活。Skills 支持分层加载,从项目到系统级别都能配置。