模型蒸馏

DeepSeek 模型蒸馏范式笔记,概览 Base/Chat 模型与 COT 数据微调流程。

495 技术#AI#DeepSeek#模型蒸馏



本站总访问量 10000
本站总访客数 500
本页总访客数 加载中...
发表了 34 篇文章 🔸 总计 111.4k 字