910B 单机部署 DeepSeek V4 Flash mtp 最佳实践(1) 主程序执行 trap 'echo e "${RED}脚本执行中断${NC}"; exit 1' INT TERM checkdependencies cleanupoldcontainer startservice verifyservice 4.3 服务启动 plaintext bash /data/deepseek/startvllmascend.sh 五、服务验证与运维 5.1 推理服务验证 plaintext curl H "ContentType: application/json" d '{"model": "deepseekv4mtp", "messages": [{"role": "user", "content": "你好"}], "maxtokens": 100}' 成功响应示例: 5.2 推理日志查看 若服务异常,可通过日志排查问题,请在容器外部执行以下指令。 5.2.1 查看实时日志(推荐) plaintext docker logs f vllmascend f 参数可实时跟踪日志输出。 5.2.2 查看历史日志 plaintext docker logs vllmascend 显示容器从启动到当前的全部日志(包括启动时的错误信息)。 六、注意事项 1. 驱动版本:请不要自行更换 910B NPU 驱动版本,避免与硬件固件不兼容导致未知问题。 2. 安全防护:生产环境建议配置安全组 IP 白名单,减少公网暴露面,并通过天翼云 WAF 防护恶意攻击。请勿将 EIP 直接无防护暴露于公网。 七、附录 天翼云 GPU 云主机产品文档:GPU云主机产品文档帮助中心 天翼云 DeepSeekV4 910B 适配版模型下载地址:< vllmascend 启动 deepseekv4 帮助文档:<
来自: