前提条件
用户通过主账号创建运维工程师子账号,并通过用户组赋予cwai developer系统策略权限。
操作步骤
- 上传镜像:算法工程师可以点击上传镜像查看镜像上传步骤介绍,对镜像进行上传操作。
- 管理镜像:可在镜像仓库列表查看已上传镜像,或对无用镜像进行删除操作。
- 创建自定义训练任务:算法工程师可点击“新建训练任务”按钮,配置队列、数据集、镜像、训练模式、启动命令等基础配置,点击“创建“完成训练任务的创建。
- 管理训练任务:算法工程师可在训练任务列表页查看任务的基本信息与状态,同时可进行详细信息查看、Tensorboard查看、监控查看、任务的中断或恢复、任务删除操作。
- 查看监控:算法工程师可以查看当前资源概览、资源监控(资源组、节点)、训练任务监控指标的变化。
一键诊断
算法工程师可以创建自助诊断任务,也可以查看诊断历史及诊断详情。