多模态模型训练 2.1.3 打开终端 打开后,进入vscode界面,左侧文件管理器中显示了当前集群的共享存储空间/work/home,用户可在此创建文件夹,确保所有节点对文件的访问。用户还可以在终端中进入共享存储目录,执行命令行操作。 2.1.4 镜像制作 若您使用天翼云算法团队推荐的qwen25vl镜像,则无论是单机训练还是多机训练,您均可跳过镜像制作步骤;若您想自行体验制作镜像,或是发现推荐的镜像内的cann版本与您当前驱动版本不匹配,则您可以在选择使用基础镜像作为开发机,然后重新在开发机内安装软件依赖以及cann包,最后将开发机中的运行环境保存为镜像。通过保存镜像,您不仅能够在日后快速复用该开发环境,还可以将其应用到多节点训练任务中,确保训练环境的一致性与稳定性。这种方式能够避免因环境差异导致的问题,实现从单机开发到多机分布式训练的无缝衔接。同时,镜像化管理还能在团队协作中发挥重要作用,便于其他成员直接使用统一环境,提升整体研发效率。 填写镜像名称与版本号后,点击“确定”按钮。 在左侧“我的镜像”选项卡中可查看镜像制作进度。 镜像制作完成后,下次创建开发机或训练任务时即可选择该自定义镜像。
来自: