专业模型训练-昇腾环境 1.配置模型开发任务 先创建模型开发IDE任务,按照如下步骤展开操作: 2.打开IDE 提交任务后,点击“启动”按钮,任务状态将依次显示启动中>环境准备中>运行中(如果长时间(>1min)界面状态未更新, 可以使用F5手动刷新界面),当状态显示为运行中后,点击操作栏“打开”按钮。 3.打开终端 打开后,显示vscode界面如下,按照下图步骤打开terminal运行终端: 左侧文件管理器中显示了当前集群的共享存储空间/work/share,用户可在此创建文件夹,确保所有节点对文件的访问。用户还可以在终端中进入共享存储目录,执行命令行操作。 4.镜像制作 您可以轻松将开发机中的运行环境保存为镜像,通过保存镜像,您不仅能够在日后快速复用该开发环境,还可以将其应用到多节点训练任务中,确保训练环境的一致性与稳定性。这种方式能够避免因环境差异导致的问题,实现从单机开发到多机分布式训练的无缝衔接。同时,镜像化管理还能在团队协作中发挥重要作用,便于其他成员直接使用统一环境,提升整体研发效率。 填写镜像名称与版本号后,点击“确定”按钮。 在左侧“镜像管理”选项卡中可查看镜像制作进度。 镜像制作完成后,下次创建开发机或训练任务时即可选择该自定义镜像。