VerySmallWoods
博客
产品
关于
咨询
GitHub
博客
/
标签
/
GRPO
GRPO
共 1 篇文章
2025年2月4日
利用UnslothUnsloth训练自己的第一款R1自主推理模型
本文介绍利用开源大模型训练工具Unsloth,基于GRPO,训练自己的R1推理模型
AI
Unsloth
GRPO