平台已预置的模型有哪些?
进入模型服务模块,选择在线服务,点击【预置服务】,可以看到平台预置的模型,平台预置了多款等基础大模型,包括通义千问、Llama、ChatGLM 等系列,可以直接使用。不同的基础模型的参数和能力不同,我们将持续推出不同能力方向的模型。
平台提供的开发工具有哪些?
JupyterLab和Visual Studio Code (VSCode)。
GPU模型脚本如何迁移到昇腾NPU上?
-
新建脚本train.py,写入以下原GPU脚本代码。
-
添加以下库代码。
import time import torch ...... import torch_npu from torch_npu.npu import amp # 导入AMP模块 from torch_npu.contrib import transfer_to_npu # 使能自动迁移
IDE无法打开图片或预览MD文件,该怎么办?
无法在IDE打开图片或预览MD文件,这是由于浏览器设置问题,需要开启Chrome浏览器 的 unsafely-treat-insecure-origin-as-secure 功能。
- 进入Chrome Flag管理界面配置: chrome://flags/#unsafely-treat-insecure-origin-as-secure。
一站式服务平台预置的镜像有哪些?
进入智算资产模块,选择我的镜像,点击【系统内置镜像】,可以看到平台内置的镜像,包括PyTorch、TensorFlow等。
如果在自定义镜像列表看不到容器镜像服务分享过来的镜像,怎么办?
请进行以下检查:
- 容器镜像服务所选区域与平台是不是同资源池。
- 截止时间是不是大于等于当前时间,超出截止时间后共享失效。
- 共享镜像状态是不是启用。
如何在模型开发JupyterLab和VSCode中使用自定义镜像?
需要将对应的软件安装包打包进您的自定义镜像中,具体方式见下方。
-
在docker file中具体执行命令。
#VSCode curl -fsSL https://code-server.dev/install.sh | sh code-server --install-extension ms-python.python
#Jupyterlab pip install jupyterlab
-
将打包好的镜像在本地起起来,然后运行如下命令安装软件,安装完成后,执行 docker commit {容器名称},打包成新镜像后,即可上传。
#VSCode curl -fsSL https://code-server.dev/install.sh | sh code-server --install-extension ms-python.python
#Jupyterlab pip install jupyterlab
我想基于自己的模型进行二次训练微调怎么做?
可以先在模型管理中导入自己的模型,在JupyterLab和VSCode创建训练任务,在挂载模型的选项中选择【模型管理】,选择已导入需要二次训练微调的模型,即可挂载自己的模型进行训练。
一站式智算服务平台是否支持IB和NVlink?
当前昇腾集群暂不支持。
如何给子账号配置资源使用的限额?
主账号管理员进入运营后台,在配置设置模块,可支持设置单用户最大同时使用的GPU/CPU数量以及并行文件存储初始分配额度。
在我的代码包、我的模型或标注数据集中,选择目的地路径为自有对象存储时,为何本地上传方式会报错(例如:Network Error)?
首先确认您已开通存储桶并完成委托授权。
其次检查您相应桶的跨域访问设置。如您需要通过前端页面上传,需要管理员(有存储控制台权限)对相应的桶开启跨域访问设置,并在暴露headers设置ETag后,才可在本页面上传。
示例:点击【去创建】跳转至存储控制台,点击Bucket名称进入详情页,下拉-常用设置-跨域访问-跨域设置-设置-创建策略,填写您所需的策略。
创建基础数据集或在开发机及训练任务中增加存储配置时,为什么不填ZOS/HPFS路径会报错?
请检查您的账号类型,这可能是平台权限策略所导致的。
- 若您是管理员用户,您可以挂载到整桶或者文件系统粒度,路径对您来说是选填项;
- 若您是普通子账号,您必须填写具体的已被授权的路径,路径对您来说是必填项,若不填写则无法提交。
创建开发机或训练任务时,点击提交后页面没有反应提交不了?
这可能是您使用了自有存储却未填写挂载路径或路径重复导致的。
建议您检查存储配置的填写,页面中找到存储配置,查看您已添加的自有存储,右拉查看容器内挂载路径是否填写或重复。
产品使用方面的问题如何反馈?
您可通过天翼云官网工单或者客服电话【400-810-9889】进行反馈。