操作步骤
- 登录云骁智算控制台,单击左侧菜单栏的菜单项【数据准备】- 【数据集】,点击页面“创建数据集”按钮。
- 配置数据基本信息,这里的资源组只能选择扩展资源组。
- 配置数据集名称,长度为1-63个字符,只能包含数字、小写字母和”-“,且首尾只能是字母或数字。
- 选择数据集所属资源组。
- 选择数据来源,支持ZOS与HPFS两种数据来源:
- 若选择数据源为HPFS,仅需在下拉框中选择可用的HPFS名称,若当前无可用HPFS文件,可在HPFS控制台先完成新建并行文件系统卷。数据源为HPFS的数据集暂不支持开启数据加速,HPFS选择完成后可直接点击“创建”按钮完成创建。
- 若选择数据源为ZOS,需要填写的内容如下:
- 选择ZOS的Bucket名称并选择Bucket下面要使用的目录路径。
- 填写访问Bucket时需要的endpoint,使用ZOS内网域名在裸金属节点访问ZOS,需要先创建ZOS对应的vpce,然后用vpce的ip替换zos内网域名中的ip,其他如http和端口等方式保持不变。
- 填写访问秘钥(AK/SK)
- 数据源为ZOS时需要开启数据加速以便更高效的数据访问。
- 选择Runtime类型,当前支持开源Alluxio。
- 选择实例副本数。
- 填写数据缓存的存储路径与该路径最多可存储缓存的大小(存储上限)
- 点击“创建”,完成数据集创建。