主账号使用流程
前置条件
已使用主账号登录到一站式智算平台
主账号使用流程
主账号的使用流程,整体如下:
注:资源配额和工作空间目前仅在杭州7资源池支持
主账号的使用流程按照AI全周期的工作流程进行,具体步骤如下:
流程 | 子任务 | 说明 | 详细指导 |
购买专属集群 | 购买专属集群 | 相比平台提供的默认集群资源,购买专属集群资源独享,隔离性更好 注:非必要步骤,可以使用平台提供的默认集群按需使用 | 需联系客户经理进行购买 |
创建资源配额/队列 | 创建资源配额/队列 | 在购买专属集群后,可以将专属集群资源按照一定维度划分成多个资源配额或队列,供成员在工作空间内进行作业时使用 注:非必要步骤,非必需购买专属集群,可以使用平台提供的默认集群,默认集群无需创建资源配额/队列,可直接使用。 | |
创建工作空间 | 创建工作空间 | 工作空间可对等于项目,不同项目相互隔离。 注:非必要步骤,非必须创建新的工作空间,可使用默认的工作空间 | |
关联资源配额/队列 | 设置工作空间内需要使用的资源配额或队列资源 | ||
成员管理 | 管理工作空间成员 | ||
数据集准备与处理 | 创建基础数据集 | 可上传基础数据集到ZOS或HPFS | |
创建标注数据集 | 创建标注数据集,可对数据集进行标注,并发布为新的数据集 | ||
数据清洗 | 可以对数据进行清洗 | ||
镜像准备 | 预置镜像 | 预置镜像即平台预先设置的完整镜像,可直接用于创建任务时使用 | |
自定义镜像 | 可以通过开发机自主制作镜像或通过天翼云容器镜像服务将镜像服务内的容器共享给一体化智算平台 | ||
他人分享镜像 | 可将自己的镜像分享给他人使用 | ||
代码准备 | 导入代码包 | 将代码上传到平台 | |
模型准备 | 导入模型 | 可将用户自己的模型或在 平台训练、精调好的模型导入到平台进行版本管理、评估及部署 | |
AI作业 | 模型开发 | 可通过启动和管理在线JupyterLab或VSCode集成开发环境在线编程进行模型开发 | |
模型训练 | 创建自定义创建训练任务,支持单机和多机分布式训练
| ||
模型精调 | 零代码快速创建和管理精调任务,提供全参微调和lora微调两种精调方式。基于平台的基础大模型,选择训练数据集和算力即可快速启动精调任务。 | ||
模型评估 | 可对模型进行评估,自动评估打分,生成评估报告 | ||
模型压缩 | 不减少模型效果的前提下压缩模型大小,进而提升模型在推理调用时的性能 | ||
模型部署 | 部署模型,提供推理服务 | ||
体验模型 | 可以对预置模型和自己部署的模型进行体验 | ||
综合管理 | 成员管理 | 查看并管理本租户下所有用户的平台使用情况 | |
总览资源 | 平台管理员能够轻松查看并管理专属集群的资源使用情况 | ||
调度中心 | 旨在让平台管理员能够轻松查看并调度集群资源 | ||
设置 | 旨在让平台管理员能够轻松查看并设置本租户下所有用户对资源使用的限额 | ||
操作审计 | 对平台操作事件进行跟踪 |
子账号使用流程
前置条件
子账号为IAM普通用户角色且已登录到一站式智算平台
主账号使用流程
若子账号为IAM管理员角色,则其拥有全部操作权限,操作流程和主账号别无二致,故角色为IAM管理员的子账号使用流程参见主账号使用流程章节;角色为IAM普通用户的子账号,使用流程如下:
子账号的使用流程主要是为了进行任务作业,具体步骤如下:
流程 | 子任务 | 说明 | 详细指导 |
数据集准备与处理 | 创建基础数据集 | 可上传基础数据集到ZOS或HPFS | |
创建标注数据集 | 创建标注数据集,可对数据集进行标注,并发布为新的数据集 | ||
数据清洗 | 可以对数据 | ||
镜像准备 | 预置镜像 | 预置镜像即平台预先设置的完整镜像,可直接用于创建任务时使用 | |
自定义镜像 | 可以通过开发机自主制作镜像或通过天翼云容器镜像服务将镜像服务内的容器共享给一体化智算平台 | ||
他人分享镜像 | 可将自己的镜像分享给他人使用 | ||
代码准备 | 导入代码包 | 将代码上传到平台 | |
模型准备 | 导入模型 | 可将用户自己的模型或在平台训练、精调好的模型导入到平台进行版本管理、评估及部署 | |
AI作业 | 模型开发 | 可通过启动和管理在线JupyterLab或VSCode集成开发环境在线编程进行模型开发 | |
模型训练 | 创建自定义创建训练任务,支持单机和多机分布式训练
| ||
模型精调 | 零代码快速创建和管理精调任务,提供全参微调和lora微调两种精调方式。基于平台的基础大模型,选择训练数据集和算力即可快速启动精调任务。 | ||
模型评估 | 可对模型进行评估,自动评估打分,生成评估报告 | ||
模型压缩 | 不减少模型效果的前提下压缩模型大小,进而提升模型在推理调用时的性能 | ||
模型部署 | 部署模型,提供推理服务 | ||
体验模型 | 可以对预置模型和自己部署的模型进行体验 | ||
综合管理 | 工作空间管理 | 查看工作空间相关信息,若是工作空间的管理员可以进行相关操作 | |
操作审计 | 对平台操作事件进行跟踪 |