基于LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B最佳实践 步骤三:测试模型微调效果 LLaMAFactory框架提供了模型推理的能力,可直接进入Chat页面加载模型进行对话。 1. 测试基础大模型效果 保持模型名称和模型路径不变,不设置检查点路径,在Chat页面直接点击加载模型,即可测试基础大模型的效果。 本案例使用prompt"天翼云弹性云主机包含哪些规格"进行测试。 基础DeepSeekR1DistillQwen7B大模型给出了通用但是错误的回答。 2. 测试微调大模型的效果 本案例采用了lora的微调方法,因此需将检查点路径设置为步骤二中完成训练的lora小模型。 本案例使用prompt"天翼云弹性云主机包含哪些规格"进行测试。 微调后的大模型能够给出符合微调数据集的回答。 从纯净版ubuntu系统构建微调环境 除了使用预装镜像外, 您也可以从任意ubuntu云主机开始, 按以下步骤搭建出LLaMAFactory微调环境, 并下载任意您需要的模型。