Pro(1) 一、引言 2026年4月24日,DeepSeek V4Pro和DeepSeek V4Flash正式发布并开源,模型上下文处理长度由原有的128K显著扩展至1M,实现近10倍的容量提升,首次增加了KV Cache滑窗和压缩算法,大幅减少Attention计算和访存开销,并通过模型架构创新更好地支持了Agent和Coding场景。本指南基于天翼云 HCC(高性能计算集群)平台,提供从集群开通、环境配置到服务部署的全流程详细操作,帮助用户快速完成 DeepSeekV4Pro 在昇腾 910B 算力上部署,实现稳定、高效的推理服务。 资源要求 管控节点:1 台搭载昇腾 910B NPU 的节点(每节点 8 × 64GB 昇腾 910B,HBM2e 显存)。 计算节点:3 台搭载昇腾 910B NPU 的节点(每节点 8 × 64GB 昇腾 910B,HBM2e 显存)。 共享存储:根据资源池选择 OceanFS 或 SFS Turbo,容量需满足模型权重、数据集与镜像存储需求(默认500GB)。 网络:节点间使用 RoCE 或高速以太网连接,管控节点绑定 EIP 用于公网访问,EIP 避免直接暴露在公网,具体可参照安全防护。 二、环境准备 2.1 集群开通 天翼云高性能计算集群(HCC)平台拥有 “基础版” 和 “大模型精简版” 两种集群版本,根据开通机器类型建议选择大模型精简版 :
来自: