2025年2月5日
笔记 - Deep dive into LLMs like ChatGPT with Andrej Karpathy
本文是Andrej Karpathy的视频 Deep dive into LLMs 的笔记
博客
记录 AI 系统、产品思考与创作者工作流的实践。
2025年2月5日
本文是Andrej Karpathy的视频 Deep dive into LLMs 的笔记
2025年2月4日
本文介绍DeepSeek知名开源大模型 R1 的最佳实践,帮助用户更好地利用模型的能力
2025年2月4日
本文介绍利用开源大模型训练工具Unsloth,基于GRPO,训练自己的R1推理模型
2025年2月2日
本文介绍知名开源大模型系列DeepSeek的本地化部署方案,以及API服务商汇总
2025年1月31日
Pydantic AI:构建 Agentic LLM 应用程序的类型安全 AI Agent 框架。随着 Pydantic AI v0.0.21 的最新发布,该框架带来了大量新特性和改进,在 AI 开发社区获得了重要关注。
2025年1月29日
机器学习中的量化入门
2025年1月27日
探索模型蒸馏技术如何实现大型模型向小型模型的知识迁移,以及在实际应用中的重要价值。
2025年1月26日
探索DeepSeek团队在大语言模型推理能力提升方面的创新方案,包括纯强化学习的R1-Zero和结合冷启动的R1模型。