2026年5月19日【AI早读 0519】Agent评估到部署,以及长时任务智能体的稳定性今天聚焦 Agent 从评估到部署 - IBM 跨场景排行榜、OpenAI×Dell 把 Codex 推进企业本地环境、Anthropic 谈长时任务稳定性,以及一份系统的 Agent 评估指南。AI DailyAI AgentCodex