使用DeepSeek-R1蒸馏属于自己推理小模型!
昨天介绍了使用DeepSeek-R1蒸馏出普通模型,今天是蒸馏出推理模型!
还记得那个复现DeepSeek-R1的aha时刻(可以理解成顿悟,模型能推理了)的项目Tiny -Zero吗?但是这个项目门槛比较高,需要4块A100显卡。
然后unsloth团队使用了GRPO这个项目,成功将成本降低到只需要7GB显存就能蒸馏出 Qwen2.5-1.5B 大小的推理模型!笔记本都能蒸馏!
如果使用15GB显存,就能处理llama-3.1-8B, Mistral-12B, 这种大小的模型了!
详细请看:github.com/unslothai/unsloth/releases/tag/2025-02
以上就是使用DeepSeek-R1蒸馏属于自己推理小模型的详细内容,更多请关注全栈开发网其它相关文章!