用户使用流程 流程 子任务 说明 详细指导 购买专属集群 购买专属集群 相比平台提供的默认集群资源,购买专属集群资源独享,隔离性更好 注:非必要步骤,可以使用平台提供的默认集群按需使用 需联系客户经理进行购买 创建队列 创建队列 在购买专属集群后,可以将专属集群资源按照一定维度划分成多个队列,供成员在工作空间内进行作业时使用 注:非必要步骤,非必需购买专属集群,可以使用平台提供的默认集群,默认集群无需创建队列,可直接使用。 数据集准备与处理 创建基础数据集 可上传基础数据集到ZOS或HPFS 数据集准备与处理 创建标注数据集 创建标注数据集,可对数据集进行标注,并发布为新的数据集 数据集准备与处理 数据清洗 可以对数据进行清洗 镜像准备 预置镜像 预置镜像即平台预先设置的完整镜像,可直接用于创建任务时使用 镜像准备 自定义镜像 可以通过开发机自主制作镜像或通过天翼云容器镜像服务将镜像服务内的容器共享给一体化智算平台 镜像准备 他人分享镜像 可将自己的镜像分享给他人使用 代码准备 导入代码包 将代码上传到平台 模型准备 导入模型 可将用户自己的模型或在 平台训练、精调好的模型导入到平台进行版本管理、评估及部署 AI作业 模型开发 可通过启动和管理在线JupyterLab或VSCode集成开发环境在线编程进行模型开发 AI作业 模型训练 创建自定义创建训练任务,支持单机和多机分布式训练 AI作业 模型精调 零代码快速创建和管理精调任务,提供全参微调和lora微调两种精调方式。基于平台的基础大模型,选择训练数据集和算力即可快速启动精调任务。 AI作业 模型评估 可对模型进行评估,自动评估打分,生成评估报告 AI作业 模型压缩 不减少模型效果的前提下压缩模型大小,进而提升模型在推理调用时的性能 AI作业 模型部署 部署模型,提供推理服务 综合管理 成员管理 查看并管理本租户下所有用户的平台使用情况 综合管理 总览资源 平台管理员能够轻松查看并管理专属集群的资源使用情况 综合管理 调度中心 旨在让平台管理员能够轻松查看并调度集群资源 综合管理 设置 旨在让平台管理员能够轻松查看并设置本租户下所有用户对资源使用的限额