用户使用流程 此章节主要介绍主账号和子账号的使用流程 主账号使用流程 前置条件 已使用主账号登录到一站式智算平台 主账号使用流程 主账号的使用流程,整体如下: 注:资源配额和工作空间目前仅在杭州7资源池支持 主账号的使用流程按照AI全周期的工作流程进行,具体步骤如下: 流程 子任务 说明 详细指导 购买专属集群 购买专属集群 相比平台提供的默认集群资源,购买专属集群资源独享,隔离性更好 注:非必要步骤,可以使用平台提供的默认集群按需使用 需联系客户经理进行购买 创建资源配额/队列 创建资源配额/队列 在购买专属集群后,可以将专属集群资源按照一定维度划分成多个资源配额或队列,供成员在工作空间内进行作业时使用 注:非必要步骤,非必需购买专属集群,可以使用平台提供的默认集群,默认集群无需创建资源配额/队列,可直接使用。 队列管理 资源配额 创建工作空间 创建工作空间 工作空间可对等于项目,不同项目相互隔离。 注:非必要步骤,非必须创建新的工作空间,可使用默认的工作空间 工作空间 创建工作空间 关联资源配额/队列 设置工作空间内需要使用的资源配额或队列资源 工作空间 创建工作空间 成员管理 管理工作空间成员 工作空间 数据集准备与处理 创建基础数据集 可上传基础数据集到ZOS或HPFS 基础数据集 数据集准备与处理 创建标注数据集 创建标注数据集,可对数据集进行标注,并发布为新的数据集 标注数据集 数据集准备与处理 数据清洗 可以对数据进行清洗 数据处理 镜像准备 预置镜像 预置镜像即平台预先设置的完整镜像,可直接用于创建任务时使用 预置镜像 镜像准备 自定义镜像 可以通过开发机自主制作镜像或通过天翼云容器镜像服务将镜像服务内的容器共享给一体化智算平台 自定义镜像 镜像准备 他人分享镜像 可将自己的镜像分享给他人使用 镜像分享 代码准备 导入代码包 将代码上传到平台 我的代码包 模型准备 导入模型 可将用户自己的模型或在 平台训练、精调好的模型导入到平台进行版本管理、评估及部署 我的模型 AI作业 模型开发 可通过启动和管理在线JupyterLab或VSCode集成开发环境在线编程进行模型开发 开发机 AI作业 模型训练 创建自定义创建训练任务,支持单机和多机分布式训练 训练任务 AI作业 模型精调 零代码快速创建和管理精调任务,提供全参微调和lora微调两种精调方式。基于平台的基础大模型,选择训练数据集和算力即可快速启动精调任务。 模型精调 AI作业 模型评估 可对模型进行评估,自动评估打分,生成评估报告 模型评估 AI作业 模型压缩 不减少模型效果的前提下压缩模型大小,进而提升模型在推理调用时的性能 模型压缩 AI作业 模型部署 部署模型,提供推理服务 模型服务 AI作业 体验模型 可以对预置模型和自己部署的模型进行体验 体验中心 综合管理 成员管理 查看并管理本租户下所有用户的平台使用情况 成员管理 综合管理 总览资源 平台管理员能够轻松查看并管理专属集群的资源使用情况 资源总览 综合管理 调度中心 旨在让平台管理员能够轻松查看并调度集群资源 调度中心 综合管理 设置 旨在让平台管理员能够轻松查看并设置本租户下所有用户对资源使用的限额 设置 综合管理 操作审计 对平台操作事件进行跟踪 操作审计