地域(Region)
是指物理数据中心所在的不同地理地域,不同地域之间内网完全隔离,保证不同地域间最大程度的稳定性和容错性。
可用区 AZ(Availability Zone)
是指在同一地域(Region)内,电力和网络互相独立的物理区域。用户提交的训练任务、在线服务、计算节点以及存放数据的云盘和对象存储均在该可用区中。控制台Header上显示的是可用区。
资源组
一个资源组是一组不同计算节点的集合,资源组内可以有不同规格的节点。用户可以根据自己的需求对资源组进行扩容、缩容。
队列
队列是一批用于特定计算任务的固定配额的资源,用户使用队列中的资源处理特定工作负载。一个队列中的节点规格是一致的。
节点
节点是集群的组成单元,每个节点对应一台物理机,按包年包月售卖。
全局管理员(主用户)
创建管理用户组和用户,为用户组设置系统策略(业务运维工程师、算法工程师),将创建的子用户划分到绑定了业务运维工程师或算法工程师策略的用户组。
业务运维工程师
使用资源组创建队列,创建和管理数据集,创建管理镜像仓库中的项目和镜像,查看资源监控指标,使用一键诊断功能。
算法工程师
可以创建和管理训练镜像,创建和管理任务,查看训练任务监控指标。
策略
是描述一组权限集的语言,它可以精确地描述被授权的资源集和操作集,通过策略,用户可以自由搭配需要授予的权限集。通过给用户组授予策略,用户组中的用户就能获得策略中定义的权限。