Pro(1) 2.1.1 高性能计算集群(HCC) 大模型精简版 功能定位:包含 Slurm 调度系统、Apptainer 高性能容器,实现deepseek服务一键启停。 开通步骤: 1. 登录天翼云控制台,进入“弹性高性能计算”产品页面,选择“高性能计算集群”,点击进入集群控制台。 2. 点击“创建集群”,在集群类型中选择“大模型精简版”。 3. 依次配置各项参数,包括计费模式、地域、可用区、集群名称、虚拟私有云、安全组、共享存储( SFS 或 OceanFS)、管理节点和计算节点的对应规格、镜像、磁盘、子网、登录密码。 4. 确认所有配置无误后,提交订单并完成集群创建,等待节点纳管完成,直至集群页面显示“可用”“配置完成”状态。 2.2 NVMe 磁盘挂载配置 昇腾910B物理机默认配备2×3.2T NVMe SSD,请格式化后用于存储模型文件,提升推理性能。 需将节点的nvme1n1和nvme0n1两块 NVMe 盘分别挂载至/mnt/nvme1n1和/mnt/nvme0n1目录。 可通过以下脚本实现自动化挂载及开机自动挂载的配置: shell !/bin/bash 设备列表 devices("/dev/nvme0n1" "/dev/nvme1n1") mountpoints("/mnt/nvme0n1" "/mnt/nvme1n1") fstype"xfs" 确保 root 权限 if [[ $EUID ne 0 ]]; then echo "请使用 root 运行此脚本!" exit 1 fi for i in "${!devices[@]}"; do device"${devices[$i]}" mountpoint"${mountpoints[$i]}"
来自: