多模态模型训练 3.1 开发机单机训练 开发机训练是模型开发过程中快速验证代码准确性和训练全流程走通的重要环节。通过开发机训练,可以高效完成模型调试和小参数模型的微调训练,以下是开发机单机训练Qwen2.5VL32BInstruct的LoRA微调的操作指南: 3.1.1 模型以及数据文件修改 修改对应的参数文件:examples/qwen2.5vl/data32b.json以及examples/qwen2.5vl/model32b.json,根据实际情况修改data32b.json中的数据集路径,包括modelnameorpath、datasetdir、dataset等字段,并根据切分方式以及是否开启激活值重计算修改model32b.json中的相应位置。 plaintext "preprocessparameters":{ "modelnameorpath":"/work/home/qwen25vl/MindSpeedMM/modelfromhf/Qwen2.5VL32BInstruct", hf原始权重路径 ... } "basicparameters":{ "datasetdir":"/work/home/qwen25vl/MindSpeedMM/data", data文件夹所在路径 "dataset":"/work/home/qwen25vl/MindSpeedMM/data/mllmformatllavainstructdata.json", 2.3.2中处理好的数据文件路径 "cachedir":"/work/home/qwen25vl/MindSpeedMM/data/cachedirlora", 可指定为任意路径,但是注意cachedir在多机上不要配置同一个路径避免写入同一个文件导致冲突 "valrate":0.1, 指定将训练集划分为验证集的比例,若不设置默认不开启训练集切分 ... } plaintext "visionencoder":{ "pipelinenumlayers":[32],
来自: