平台已预置的模型有哪些?
进入模型服务模块,选择在线服务,点击【预置服务】,可以看到平台预置的模型,平台预置了多款等基础大模型,包括通义千问、Llama、ChatGLM 等系列,可以直接使用。不同的基础模型的参数和能力不同,我们将持续推出不同能力方向的模型。
平台提供的开发工具有哪些?
JupyterLab和Visual Studio Code (VSCode)。
GPU模型脚本如何迁移到昇腾NPU上?
新建脚本train.py,写入以下原GPU脚本代码。
添加以下库代码。
import time import torch ...... import torch_npu from torch_npu.npu import amp # 导入AMP模块 from torch_npu.contrib import transfer_to_npu # 使能自动迁移
IDE无法打开图片或预览MD文件,该怎么办?
无法在IDE打开图片或预览MD文件,这是由于浏览器设置问题,需要开启Chrome浏览器 的 unsafely-treat-insecure-origin-as-secure 功能。
进入Chrome Flag管理界面配置: chrome://flags/#unsafely-treat-insecure-origin-as-secure。
训推智算服务平台预置的镜像有哪些?
进入智算资产模块,选择我的镜像,点击【系统内置镜像】,可以看到平台内置的镜像,包括PyTorch、TensorFlow等。
如果在自定义镜像列表看不到容器镜像服务分享过来的镜像,怎么办?
请进行以下检查:
容器镜像服务所选区域与平台是不是同资源池。
截止时间是不是大于等于当前时间,超出截止时间后共享失效。
共享镜像状态是不是启用。
如何在模型开发JupyterLab和VSCode中使用自定义镜像?
需要将对应的软件安装包打包进您的自定义镜像中,具体方式见下方。
在docker file中具体执行命令。
#VSCode curl -fsSL https://code-server.dev/install.sh | sh code-server --install-extension ms-python.python#Jupyterlab pip install jupyterlab将打包好的镜像在本地起起来,然后运行如下命令安装软件,安装完成后,执行 docker commit {容器名称},打包成新镜像后,即可上传。
#VSCode curl -fsSL https://code-server.dev/install.sh | sh code-server --install-extension ms-python.python#Jupyterlab pip install jupyterlab
我想基于自己的模型进行二次训练微调怎么做?
可以先在模型管理中导入自己的模型,在JupyterLab和VSCode创建训练任务,在挂载模型的选项中选择【模型管理】,选择已导入需要二次训练微调的模型,即可挂载自己的模型进行训练。
训推智算服务平台是否支持IB和NVlink?
当前昇腾集群暂不支持。
如何给子账号配置资源使用的限额?
主账号管理员进入运营后台,在配置设置模块,可支持设置单用户最大同时使用的GPU/CPU数量以及并行文件存储初始分配额度。
创建基础数据集或在开发机及训练任务中增加存储配置时,为什么不填ZOS/HPFS路径会报错?
请检查您的账号类型,这可能是平台权限策略所导致的。
若您是管理员用户,您可以挂载到整桶或者文件系统粒度,路径对您来说是选填项;
若您是普通子账号,您必须填写具体的已被授权的路径,路径对您来说是必填项,若不填写则无法提交。
点击Tensorboard没反应?
1、需要检查是否被浏览器拦截;
2、输出目录有限制:必须将数据写入指定的目录;
3、最多支持开启10个(同一个任务点击2次=开2个)。
查看监控时,无法选择我需要的时间?
注意时间的选择由时间精度(分、时、日)与时间范围共同控制:
选择时间精度为分,图像步长为1分钟,时间跨度至多1天;
选择时间精度为时,图像步长为1小时,时间跨度至多7天;
选择时间精度为日,图像步长为1天,时间跨度至多31天;
当您需选择更大的时间跨度时,可能需要同时调整相应的时间精度。
产品使用方面的问题如何反馈?
您可通过天翼云官网工单或者客服电话【400-810-9889】进行反馈。