昇腾 910B 物理机大EP推理方案部署指南 3.3 查看 DeepSeek 大 EP 服务状态 可通过 slurm 命令squeue查看作业运行信息: plaintext $ squeue JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 892 batch coordina root R 2:43 8 hpcep910bcompute[00010007],hpcep910bmaster0001 893 batch controll root R 2:43 8 hpcep910bcompute[00010007],hpcep910bmaster0001 889 batch prefill root R 2:46 2 hpcep910bcompute0001,hpcep910bmaster0001 890 batch prefill root R 2:46 2 hpcep910bcompute[0003,0006] 891 batch decode root R 2:46 4 hpcep910bcompute[0002,00040005,0007] 注意 可在/home/lsepdeepseek/logs目录中查看当前作业的日志文件。 3.4 停止 DeepSeek 大 EP 服务 执行以下命令即可停止 DeepSeek 大 EP 服务: plaintext $ sh lsepstop.sh 如需清理历史 DeepSeek 大 EP 服务的所有日志,可执行: plaintext $ sh lsepclean.sh 注意 ascend目录下会生成大量日志文件,可能占用较多磁盘空间,建议定期清理。 四、大模型服务调用 4.1 API 接口调用 当前大 EP 方案中,模型信息端口与推理服务端口分离,默认端口设置如下: 模型信息接口: 推理服务端口:3025 推理服务 API 接口: 其中,[IP1]为步骤 2.1 中配置的 coordinator 服务部署节点的 IP 地址。