活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      弹性云主机

      弹性云主机

        • 产品动态
        • 新手指引
        • 操作导航
        • 新手入门:购买并登录Windows弹性云主机
        • 新手入门:购买并登录Linux弹性云主机
        • DeepSeek专题
        • DeepSeek专题导航
        • 图解DeepSeek与公有云深度融合
        • 从基础设施到智能中枢:DeepSeek如何重塑公有云服务价值链
        • 高性能GPU云主机助力DeepSeek深度应用
        • 天翼云SD-WAN与DeepSeek超强联动,开启云上高效互联新时代
        • 实践指南:DeepSeek驱动高效能云生态
        • GPU云主机/弹性云主机:零基础搭建DeepSeek云端环境指南
        • 在天翼云使用Ollama运行DeepSeek的最佳实践-7B等版本
        • 基于OpenWebUI+Ollama+DeepSeek实现大模型私有知识库零代码构建的最佳实践
        • 基于DeepSeek和Chroma构建个性化知识库的最佳实践
        • 基于LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B最佳实践
        • 基于Open WebUI实现DeepSeek API调用及外部大模型API接入最佳实践
        • AnythingLLM 协同 Ollama 启用 DeepSeek 大模型最佳实践
        • CherryStudio 协同 Ollama 启用 DeepSeek 大模型
        • 天翼云CPU实例部署DeepSeek-R1模型最佳实践
        • GPU物理机:物理机搭建DeepSeek指南
        • SD-WAN跨境:SD-WAN助力DeepSeek模型定向加速
        • 智算容器:云容器引擎与DeepSeek融合实践
        • 函数计算:天翼云函数计算与DeepSeek大模型
        • Q&A:典型问题解析与策略应对
        • 产品概述
        • 产品定义
        • 术语解释
        • 产品优势
        • 弹性云主机选型
        • 功能特性
        • 产品应用场景
        • 产品使用须知
        • 产品使用限制
        • 云主机与其他服务之间的关系
        • 产品规格
        • 规格说明
        • 规格族
        • 通用云主机
        • 概述
        • 通用型
        • 计算型
        • 内存型
        • 增强型
        • 本地盘云主机
        • GPU云主机
        • 国产云主机
        • 鲲鹏系列
        • 海光系列
        • 飞腾系列
        • 经济型云主机
        • 镜像
        • 镜像类型
        • Cloud-init
        • 网络
        • 云硬盘
        • 地域和可用区
        • 购买指南
        • 计费说明
        • 计费项及其计费方式
        • 价格与折扣
        • 计费模式
        • 按量计费模式
        • 包年包月计费模式
        • 变更配置
        • 变更配置概述
        • 支持变配的实例规格
        • 云主机冷变配规则说明
        • 云主机热变配规则说明
        • 续费说明
        • 规则说明
        • 手动续订
        • 自动续订
        • 退费说明
        • 规则说明
        • 退费流程
        • 包周期按量互转
        • 成本优化
        • 计费FAQ
        • 快速入门
        • 注册账号
        • 创建弹性云主机
        • 登录Linux弹性云主机
        • 登录Windows弹性云主机
        • 初始化数据盘
        • 入门实践
        • 修订记录
        • 用户指南
        • 云主机实例
        • 实例生命周期
        • 查看实例
        • 查看实例状态
        • 查看实例详情
        • 导出实例信息
        • 搜索实例
        • 登录实例
        • 登录Windows弹性云主机实例
        • Windows弹性云主机登录方式概述
        • Windows弹性云主机控制中心远程登录(VNC方式)
        • 远程桌面连接(MSTSC方式)
        • 在Linux主机上登录Windows云主机
        • 在移动设备上登录Windows云主机
        • Mac OS系统登录Windows云主机
        • 登录Linux弹性云主机实例
        • Linux弹性云主机登录方式概述
        • Linux弹性云主机远程登录(VNC方式)
        • SSH密钥方式登录
        • SSH密码方式登录
        • 在移动设备上登录Linux云主机
        • Mac OS系统登录Linux云主机
        • 管理远程登录用户
        • 管理实例属性
        • 修改实例名称
        • 修改主机名称(hostname)
        • 批量设置有序的实例名称或主机名称
        • 修改实例描述
        • 更改实例时区
        • 开启和关闭实例保护功能
        • 配置主机名与IP地址的映射
        • 实例自定义数据注入
        • 实例自定义元数据
        • 管理实例状态
        • 开机实例
        • 关机实例
        • 重启实例
        • 重装操作系统
        • 变更规格
        • 创建相同配置实例
        • 克隆实例
        • 管理云主机组
        • 安装驱动和工具包(可选)
        • NVIDIA驱动安装指引
        • 创建配备GPU驱动的GPU云主机(Linux)
        • 安装GRID驱动
        • 卸载GRID驱动
        • 安装Tesla驱动
        • 卸载Tesla驱动
        • 使用可信云主机
        • 云主机启动模版
        • 创建云主机启动模版
        • 查看云主机启动模版
        • 修改云主机启动模版
        • 使用云主机启动模版创建云主机
        • 删除云主机启动模版
        • 云主机镜像
        • 镜像概述
        • 通过镜像创建云主机
        • 通过云主机创建Windows私有镜像
        • 通过云主机创建Linux私有镜像
        • 镜像更多操作
        • 云硬盘
        • 云硬盘概述
        • 创建云硬盘
        • 挂载数据盘
        • 卸载数据盘
        • 扩容云硬盘
        • 加密云硬盘
        • 云硬盘加密概述
        • 管理加密云硬盘
        • 随主机释放设置
        • 弹性IP
        • 弹性IP概述
        • 绑定弹性IP
        • 解绑弹性IP
        • 更换弹性IP
        • 修改弹性IP带宽
        • 使用SNAT访问公网
        • 密码和密钥对
        • 密码
        • 密码使用场景介绍
        • 在控制台重置密码
        • 密钥对
        • 密钥对使用场景介绍
        • 在控制台创建密钥对
        • 导入密钥对
        • 为云主机绑定/更换密钥对
        • 为云主机解绑密钥对
        • 网卡
        • 弹性网卡概述
        • 创建弹性网卡
        • 管理弹性网卡
        • 修改弹性网卡基本信息、分配IPv6、辅助私网IP
        • 如何修改内网IP、切换VPC
        • 开启网卡多队列功能
        • 虚拟IP概述
        • IPv6带宽
        • 云主机备份
        • 备份弹性云主机
        • 文件系统
        • 一键挂载文件系统
        • 监控
        • 监控弹性云主机
        • 监控Agent概览
        • 监控Agent版本说明
        • 安装监控Agent
        • 云主机支持的操作系统监控指标(安装监控Agent)
        • 设置告警规则
        • 查看监控指标
        • 安全
        • 提升云主机安全的方法
        • 服务的访问控制
        • 安全组
        • 安全组概述
        • 安全组配置示例
        • 配置安全组规则
        • 修改安全组规则
        • 更改安全组
        • 数据保护技术
        • Hypervisor安全
        • 用户加密
        • 重点操作短信二次验证
        • 验证规则
        • 开启重点操作短信验证
        • 关闭重点操作短信验证
        • 故障恢复
        • 云服务器CTIAM
        • 统一身份认证IAM介绍
        • 通过IAM用户控制资源访问
        • 迁移
        • 迁移云主机实例
        • 迁移本地盘云主机数据
        • 运维
        • 云助手
        • 云助手产品介绍
        • 安装云助手客户端
        • 购买指南
        • 创建命令
        • 免登录执行命令
        • 查看命令执行结果
        • 查看和执行公共命令
        • 上传文件
        • 查看文件上传结果
        • 资源与标签
        • 标签管理
        • 标签概述
        • 标签设计原则及示例
        • 绑定标签
        • 使用标签筛选资源
        • 解绑标签
        • 云主机服务委托
        • 配额调整
        • 云主机快照
        • 云主机快照管理
        • 云主机快照策略
        • 常见问题
        • 高频常见问题
        • 地域与可用区类
        • 如何选择地域?
        • 地域之间是否存在差异?
        • 已购买的弹性云主机,是否支持更换地域?
        • 什么是可用区,怎样选择可用区?
        • 可用区之间的数据传输是否需要收费?
        • 是否可以将应用的不同组件分散部署到不同的地域?
        • 是否提供应用灾备的相关服务?
        • 是否可以在不同的地域之间实施应用灾备?
        • 如何获取弹性云主机的物理机房位置?
        • 购买与退订冻结相关问题
        • 弹性云主机提供哪些计费方式,区别是什么?
        • 同一台云主机是否同时支持两种计费方式?
        • 是否支持更改已有云主机的计费方式?
        • 账户里面有余额,为什么无法创建按量付费云主机?
        • 弹性云主机关机后还会继续计费吗?
        • 一个账户最多可以创建多少按量付费的云主机?
        • 如何选择适合业务的云主机实例?
        • 购买实例时,资源已经售罄怎么办?
        • 什么是ARM CPU架构与X86 CPU架构?
        • 控制台无法看到云主机,如何处理?
        • 如何处理支付订单后云主机开通失败?
        • 申请开通弹性云主机需要多久?
        • 什么情况下弹性云主机会被冻结,冻结后怎么办?
        • 如何退订弹性云主机?
        • 已到期资源如果续订,续订周期如何计算?
        • 是否支持账户余额变动提醒?
        • 弹性云主机怎样停止计费?
        • 创建与删除
        • 创建类
        • 删除类
        • 登录与连接
        • VNC登录类
        • VNC方式登录后,播放音频文件没有声音怎么办?
        • 如何修改Windows弹性云主机的分辨率
        • 怎样修改远程登录的端口?
        • 修改Linux弹性云主机的默认SSH端口后,使用新端口无法登录?
        • 使用 VNC远程登录,想要复制本地字符发送到虚机中,发现一次性无法达到描述的3000个字符
        • VNC方式登录弹性云主机后,较长时间不操作,界面无响应怎么办
        • 控制台登录类
        • VNC方式登录弹性云主机时,登录界面显示乱码怎么办?
        • 通过控制台登录弹性云主机时提示1006或1000怎么办?
        • VNC方式登录弹性云主机时,系统黑屏输入无反应?
        • VNC方式登录弹性云主机后,查看数据失败,VNC无法正常使用?
        • 登录前准备类
        • 使用创建时的用户名和密码无法SSH方式登录云主机
        • 远程登录时需要输入的帐号和密码是什么
        • 弹性云主机登录前准备工作有哪些
        • 远程登录忘记密码怎么办
        • 远程连接类
        • MSTSC方式登录Windows 2012的弹性云主机,登录失败怎么办?
        • Windows 2012系统卸载某些软件后无法进入系统桌面怎么办?
        • 远程登录弹性云主机时,对浏览器版本的要求?
        • 使用私有镜像创建Windows弹性云主机时设置的密码不生效怎么办?
        • 弹性云主机实例出现了异地登录怎么办
        • 无法远程登录Windows云主机怎么办
        • 无法远程登录Linux云主机怎么办
        • 规格变更类
        • 弹性云主机怎样变更规格
        • 国产化云主机变配有什么限制
        • 主机升配后CPU的ID是否会变化
        • Windows弹性云主机变更规格后磁盘脱机怎么办?
        • Linux弹性云主机变更规格后磁盘脱机怎么办?
        • 弹性云主机变配操作无法成功提交
        • 使用故障类
        • 弹性云主机使用时有什么限制
        • 宿主机故障时,弹性云主机是否能自动恢复
        • 如何处理管理控制台异常提示信息
        • 如何修改弹性云主机(Windows)的SID
        • Windows弹性云主机没有声音
        • 弹性云主机配置的邮件无法正常发送
        • 使用free -m命令查询弹性云主机内存大小与实际配置不符
        • linux虚机内关键文件路径
        • 鲲鹏、海光、飞腾系列云主机挂载云硬盘和弹性网卡异常
        • 操作系统管理
        • 图形化系统安装类
        • 云主机是否有图形界面
        • CentOS 7系列弹性云主机如何安装图形化界面
        • CentOS 8系列弹性云主机如何安装图形化界面
        • Ubuntu系列弹性云主机如何安装图形化界面
        • Debian系列弹性云主机安装图形化界面流程
        • 操作系统故障类
        • 针对Intel处理器芯片存在的Meltdown和Spectre安全漏洞,应该如何规避?
        • 如何开启CentOS操作系统的SELinux功能?
        • 怎样查看GPU加速型云主机的GPU使用率?
        • Linux弹性云主机如何升级内核?
        • 用户自持镜像导致的弹性云主机操作系统无法正常启动是什么原因?
        • 文件系统损坏,Linux弹性云主机启动失败
        • 文件系统checkfs使用 fsck 工具检查并修复文件系统
        • 重装操作系统
        • 重装弹性云主机时是否可以选择其他操作系统
        • 重装操作系统需要多长时间?
        • 用户能否自己安装或者升级操作系统
        • 重装/切换操作系统/变更规格对磁盘数据有影响吗
        • 文件上传/数据传输
        • 使用FTP上传文件时写入失败、文件传输失败
        • WinSCP无法连接到Linux云主机
        • Windows云主机搭建了FTP,通过公网无法访问
        • 使用FTP上传文件时客户端连接服务端超时
        • 本地Windows主机通过MSTSC上传文件到Windows云主机
        • 本地Windows主机使用对象存储上传文件到Windows云主机
        • 本地Windows主机使用WinSCP上传文件到Linux云主机
        • 本地MacOS系统主机上传文件到Windows云主机
        • 本地Linux主机使用SCP上传文件到Linux云主机
        • 本地Linux主机使用SFTP上传文件到Linux云主机
        • 本地Windows主机使用FTP上传文件到Windows/Linux云主机
        • 本地Linux主机使用FTP上传文件到Linux云主机
        • 怎样在本地主机和Windows云主机之间互传数据?
        • FTP服务器上的文件夹因权限访问出错怎么办?
        • 迁移云服务器
        • 弹性云主机可以迁移到其他地域/帐号吗?
        • 镜像源管理
        • 内网yum源及NTP配置
        • Windows或Linux操作系统镜像怎么选
        • 常见docker源配置指导
        • 磁盘管理类
        • 磁盘分区与虚拟内存类
        • 磁盘扩容类
        • 卸载云硬盘操作指南及故障排除
        • 其它
        • 密码与密钥对类
        • 密码
        • 云主机默认密码是多少?
        • 忘记天翼云账号密码怎么办?
        • 如何在控制台重置弹性云主机密码?
        • 如何在操作系统内部修改云主机密码?
        • 用户创建弹性云主机成功后远程登录提示密码错误?
        • 一键重置密码后无法使用新密码登录弹性云主机
        • 用户未修改密码,正常使用弹性云主机一段时间后无法登录
        • 如何关闭Selinux?
        • 密钥对
        • 如何创建密钥对?
        • 如何使用密钥对?
        • 密钥对无法下载
        • 无法导入密钥对
        • 怎样查询弹性云主机使用的密钥对是哪个?
        • 已开云主机是否还支持使用密钥对?
        • 如何在云主机上使用安装USB类型的Ukey秘钥?
        • 弹性云主机中使用cloudbase-init是什么?
        • Python升级导致Cloud-init不工作
        • 使用密钥文件无法正常登录Linux弹性云主机
        • 通过puttygen.exe工具创建的密钥对,导入管理控制台失败
        • 网络配置类
        • 弹性IP类
        • DNS与NTP配置类
        • 配置DNS
        • 怎样配置弹性云主机的DNS和NTP信息?
        • 网卡类
        • 弹性云主机添加网卡后是否会自动启动?
        • 怎样修改云主机的VPC网段、子网的网段?
        • 路由类
        • iptables如何配置、建议配置规则指导
        • 访问网站或应用故障类
        • 其它类
        • 云主机mac是否为固定的?
        • DHCP无法正常获取内网IP?
        • 如何查看、修改Linux弹性云主机的内核参数?
        • 端口映射配置
        • 如何查看云主机的mac地址?
        • 不同帐号下弹性云主机内网是否可以互通?
        • 我购买的云主机是否在同一子网?
        • 云主机网络优化方案
        • 如何排查带宽超过限制
        • 安全类
        • 怎么设置云主机密码可以在一定程度上提升云主机安全
        • 安全组和安全规则配额是多少
        • 安全组加规则报错:参数错误,请检查你的参数
        • 如何关闭重点操作短信验证
        • 弹性云主机上是否可以搭建数据库
        • 如何保护弹性云主机安全
        • 如何防止实例被暴力破解
        • 云主机卡顿
        • Windows云主机卡顿
        • Linux云主机卡顿
        • 数据库应用
        • 弹性云主机是否支持Oracle数据库?
        • 云主机快照常见问题
        • 监控类
        • 云主机无监控数据如何处理
        • 如何重启监控Agent
        • 监控Agent自动退出如何处理
        • 产品咨询类
        • 怎样注册天翼云
        • 弹性云主机可以做什么
        • 私有数据是否支持物理邮寄
        • 升级CPU、内存、带宽时是否需要关机
        • Linux虚机product_uuid参数是否可以修改
        • 香港节点的云主机是否可以实现与国内云主机互通
        • 云主机windows 2019操作系统对应普通电脑哪个操作系统
        • 其它类
        • 云助手常见问题
        • 故障修复
        • 高频故障案例
        • Linux操作系统执行passwd命令重置密码失败提示:Authentication token manipulation error
        • 云主机错误状态及解决方案
        • 如何解决云平台创建云主机状态错误
        • 云主机端口不通怎样排查?
        • 云主机网络延迟和丢包,如何定位
        • 弹性云主机启动缓慢
        • ping不通或丢包时如何进行链路测试?
        • 云主机带宽占用高怎么办
        • Linux系统云主机如何自查病毒及中病毒后处理建议
        • Windows系统云主机如何自查病毒及中病毒后处理建议
        • 操作系统类(Windows)
        • 云主机时间与标准时间不一致
        • Windows弹性云主机蓝屏如何处理
        • Windows弹性云主机配置双网卡外网访问
        • Windows无法正常启动时怎样恢复数据?
        • 如何查看Windows云主机的登录日志?
        • CentOS设置系统时区
        • 启动Tomcat时报错,提示80端口被占用怎么办?
        • 怎样实现Windows云主机文件共享?
        • 输入法无法使用怎么办?
        • windows操作系统下卸载云硬盘操作指南及故障排除
        • 怎样设置Windows弹性云主机首选语言
        • Windows云主机配置文件共享和网络磁盘映射方法
        • Windows云主机如何保持会话连接长时间不断开?
        • Windows弹性云主机不能复制粘贴内容?
        • 云主机错误状态处理方式
        • 弹性云主机配置的邮件无法正常发送
        • 如何解决云平台创建云主机状态错误
        • 云主机错误状态及解决方案
        • 操作系统类(Linux)
        • 弹性云主机新内核启动失败如何设置使用第二内核启动
        • 为什么操作系统实际版本和购买时的镜像版本不一致?
        • 怎样配置Linux分析工具:atop和kdump
        • Ubuntu操作系统如何设置默认启动内核
        • Linux操作系统云主机安装Docker支持的操作系统版本
        • 弹性云主机IP地址丢失处理方法
        • 内核参数kernel.unknown_nmi_panic配置错误导致Linux弹性云主机异常重启
        • pip安装软件时出现错误:command ´gcc´ failed with exit status 1
        • CentOS云主机根目录设置成777权限后如何恢复?
        • Linux弹性云主机执行命令或启动服务时出现错误:Cannot allocate memory
        • 无法编辑fstab文件怎么办
        • 非root用户切root用户时,连接超时怎么办?
        • Web访问超时且系统日志打印:nf_conntrack: table full, dropping packet
        • 修改/etc/security/limits.conf文件,重启后不生效怎么办?
        • emergency mode(紧急模式)问题处理方法
        • 使用taskset命令让进程运行在指定CPU上
        • 弹性云主机中/etc/rc.local开机启动脚本不生效怎么办?
        • 网络配置
        • resolv文件被重置怎么办?
        • Linux系统重启后/etc/hosts自动添加主机名解析
        • CentOS 7重启后dhclient未运行,导致无法获取IP
        • Linux系统使用多网卡时网卡名称出现漂移
        • 同一子网的两块网卡均绑定弹性公网IP
        • 远程连接报错
        • 远程连接云主机出现蓝屏
        • 远程连接Windows云主机报错:出现身份验证错误,要求的函数不受支持
        • 天翼云Windows云主机远程连接时出现报错: 此计算机无法连接到远程计算机
        • 远程连接Windows云主机报错:没有远程登录的权限
        • 登录Windows云主机提示“内部错误”怎么办?
        • 远程连接Windows云主机报错:无法验证此远程计算机的身份
        • Windows云主机远程连接时出现报错:RDP连接断开,出现内部错误
        • Windows云主机远程连接时出现报错:您的连接已丢失
        • Windows云主机报错:您的凭据无法工作
        • 磁盘空间管理
        • Linux操作系统云主机中buffer和cache占用内存怎么办?
        • Linux文件系统提示:Read-only file system
        • Linux操作系统云主机磁盘分区提示空间不足怎么办?
        • 文件已经删除,但空间未释放怎么办?
        • Inode节点耗尽导致无法创建新文件问题处理
        • Linux如何创建swap分区/swap文件
        • GPU驱动故障
        • GPU驱动异常怎么办?
        • GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办?
        • GPU设备显示异常
        • T4 GPU设备显示异常
        • G系列弹性云主机GPU驱动故障
        • GPU驱动不可用
        • SSH连接
        • /etc/passwd文件损坏导致云主机登录失败怎么办?
        • 怎样设置允许或禁止用户/IP通过SSH连接云主机?
        • Linux启动sshd服务出现/var/empty/sshd无法访问的解决方案
        • CentOS 7修改SSH默认端口后无法连接怎么办?
        • 开启UseDNS导致SSH连接缓慢怎么办?
        • 怎样禁用SSH密码方式连接云主机?
        • 怎样长时间保持SSH会话连接不断开?
        • 多用户登录
        • 配置多用户登录后,普通用户登录闪屏怎么办?
        • Windows云主机如何配置多用户登录?(Windows 2008)
        • 多用户登录Windows主机时无法打开浏览器
        • Windows云主机如何配置多用户登录?(Windows 2012)
        • 密码与密钥对
        • Linux 云主机怎样切换密钥登录为密码登录?
        • Linux云主机如何进入单用户模式重置root密码
        • 密钥对方式购买的弹性云主机,使用私钥文件获取登录密码失败
        • 使用密钥文件无法正常登录 Linux 弹性云主机
        • 如何更换密钥对
        • Linux云主机重置密码
        • 无法导入密钥对
        • 安装IIS服务
        • 怎样做网页定向?
        • IIS服务修改已绑定的网站域名
        • Windows云主机上安装IIS服务
        • 最佳实践
        • 创建云主机最佳实践
        • 为Windows Server添加AD、DHCP、DNS、IIS服务
        • 基于Tomcat构建Java web环境(CentOS 7.4)
        • Mysql数据库自建,使用,问题排查最佳实践
        • 典型网站类场景
        • 镜像部署Windows环境
        • 麒麟系统云主机配置图形化界面
        • 下载并安装SQL Server
        • 线下OpenStack环境导入公有云环境
        • 创建双栈云主机
        • 弹性云主机配置
        • 弹性云主机之间迁移最佳实践
        • Linux服务器SSH登录的安全加固
        • 使用VNC Viewer连接Linux云主机
        • Linux系统进入单用户模式
        • 修改云主机默认远程端口
        • 设置Windows操作系统首选语言
        • ECS安全组实践(入方向规则)
        • 针对云主机的最佳实践
        • 搭建微信公众号后台
        • 网站性能测试的最佳实践
        • 网络性能测试的最佳实践
        • 网站搭建指导
        • 手动部署Java Web
        • 基于天翼云ECS搭建Oracle RAC集群
        • 手动搭建LNMP环境
        • 快速构建FTP站点(Linux)
        • 快速构建FTP站点(Windows)
        • 搭建FTP
        • 手工部署RabbitMQ(CentOS 7.4)
        • 在天翼云上配置NTP服务器
        • 跨账号同区域迁移云主机
        • 手工搭建Ghost博客(Ubuntu 20.04)
        • 手工安装宝塔面板(CentOS7.2)
        • 通过配置监控Agent实现指定进程监控
        • 快速部署SD-WAN vCPE最佳实践
        • 部署Palworld幻兽帕鲁服务器最佳实践
        • 部署Palworld幻兽帕鲁服务器最佳实践(Ubuntu)
        • 部署Palworld幻兽帕鲁服务器最佳实践(Windows)
        • Palworld幻兽帕鲁世界参数修改最佳实践(Ubuntu)
        • Palworld幻兽帕鲁世界参数修改最佳实践(Windows)
        • Palworld幻兽帕鲁更新游戏最佳实践
        • 已有天翼云Ubuntu云主机,搭建幻兽帕鲁服务器
        • 已有天翼云Windows云主机,搭建幻兽帕鲁服务器
        • 大模型学习机最佳实践
        • 一键部署与登录Llama 3/Llama 2大模型学习机
        • 部署与登录Llama 3/Llama 2大模型学习机
        • 已有天翼云云主机,部署与登录Llama 3/Llama 2大模型学习机
        • 修改大模型学习机登录密码
        • 大模型学习机服务启停最佳实践
        • 大模型学习机图像生成最佳实践
        • 大模型学习机文本生成最佳实践
        • 大模型学习机文本生成模型微调最佳实践
        • 使用大模型学习机微调自己的文本生成模型
        • 使用大模型学习机微调自己的图像生成模型
        • AIGC实践
        • 在天翼云使用Ollama运行DeepSeek的最佳实践-7B等版本
        • 在天翼云使用vLLM运行DeepSeek的最佳实践-32B等版本
        • 基于DeepSeek和Chroma构建个性化知识库的最佳实践
        • 基于OpenWebUI+Ollama+DeepSeek实现大模型私有知识库零代码构建的最佳实践
        • 基于LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B最佳实践
        • 基于CPU的AI推理加速技术在天翼云EMR云主机上的应用
        • 基于Open WebUI实现DeepSeek API调用及外部大模型API接入最佳实践
        • AnythingLLM 协同 Ollama 启用 DeepSeek 大模型最佳实践
        • CherryStudio 协同 Ollama 启用 DeepSeek 大模型
        • 天翼云CPU实例部署DeepSeek-R1模型最佳实践
        • Open WebUI 快速入门
        • 天翼云 GPU 云主机构建高性能 Deepseek 集群最佳实践-32B等版本
        • 使用云主机启动模版快速部署DeepSeek的最佳实践
        • 弹性伸缩搭配GPU云主机水平扩展最佳实践
        • 基于Anything LLM实现云主机外挂Embedding模型、向量数据库的最佳实践指南
        • Open WebUI及vLLM版本升级最佳实践
        • API参考
        • 调用前必知
        • 概述
        • 终端节点
        • 请求状态码
        • 状态枚举值
        • API概览
        • 如何调用API
        • 认证鉴权
        • 构造请求
        • Python调用示例
        • API
        • 2022-09-09
        • 新版
        • 云主机生命周期管理
        • 删除云主机及释放关联资源
        • 全部操作云主机
        • 创建相同配置的云主机
        • 批量释放云主机
        • 克隆云主机
        • 创建一台按量付费或包年包月的云主机
        • 批量创建按量付费或包年包月云主机
        • 续订一台包周期的云主机
        • 释放云主机
        • 云主机添加共享网卡
        • 节省关机一台云主机
        • 节省关机多台云主机
        • 开启一台云主机
        • 关闭一台云主机
        • 销毁一台包周期已退订云主机
        • 重启一台云主机
        • 重装一台云主机
        • 开启多台云主机
        • 关闭多台云主机
        • 重启多台云主机
        • 重装多台云主机
        • 云主机查询
        • 查询云主机支持的冷变配规格信息
        • 根据masterOrderID查询云主机ID
        • 查询一个异步任务的结果
        • 查询用户云主机统计信息
        • 查询云主机支持的热变配规格信息
        • 查询云主机的云硬盘列表
        • 查询用户云硬盘统计信息
        • 查询GPU云主机驱动版本
        • 查询云主机的WEB管理终端地址
        • 查询云主机的固定IP
        • 获取多台云主机的状态信息
        • 查询云主机列表
        • 查询一台或多台云主机详细信息
        • 查询一台云主机详细信息
        • 查询多个异步任务的结果
        • 查询一台云主机的自定义数据
        • 查询指定规格族下的云主机信息
        • 查询云主机规格族列表
        • 查询一个或多个云主机规格资源
        • 云主机修改信息
        • 编辑云主机标签
        • 批量绑定解绑云主机标签
        • 云主机热变配
        • 更新云主机的部分信息
        • 更新多台云主机的部分信息
        • 更新云主机密码
        • 更新云主机实例删除保护信息
        • 更新多台云主机的密码
        • 云主机修改带宽或规格
        • 云主机修改规格
        • 云主机修改带宽
        • 云主机委托管理
        • 云主机清除委托
        • 云主机绑定委托
        • 云主机组管理
        • 删除云主机组
        • 更新云主机组信息
        • 云主机组批量移除云主机
        • 云主机加入主机组校验
        • 云主机组中删除单台云主机
        • 云主机组中添加单台云主机
        • 创建云主机组
        • 查询云主机组内的云主机
        • 查询云主机所在云主机组
        • 查询云主机组列表或者详情
        • 快照管理
        • 快照任务管理
        • 查询云主机快照任务列表
        • 批量删除云主机快照
        • 快照策略管理
        • 修改云主机快照策略
        • 停用云主机快照策略
        • 创建云主机快照策略
        • 启用云主机快照策略
        • 快照策略绑定云主机
        • 快照策略解绑云主机
        • 查询云主机快照任务列表
        • 查询云主机快照策略列表
        • 查询云主机快照策略详情
        • 查询快照策略绑定云主机列表
        • 立即执行云主机快照策略
        • 删除云主机快照策略
        • 快照创建一台云主机
        • 云主机快照个数统计
        • 查询云主机快照详情
        • 云主机快照状态
        • 查询云主机快照列表
        • 删除云主机快照
        • 批量更新云主机快照信息
        • 更新云主机快照信息
        • 创建云主机快照
        • 恢复云主机快照
        • 密钥对管理
        • 绑定SSH密钥对到Linux云主机
        • 查询一个或多个密钥对
        • 创建一对SSH密钥对
        • 导入RSA密钥对
        • 删除SSH密钥对
        • 为云主机解绑SSH密钥对
        • 元数据管理
        • 批量删除云主机元数据
        • 云主机元数据创建
        • 云主机元数据查询
        • 云主机元数据更新
        • 云主机元数据删除
        • 文件系统
        • 查询文件系统关联虚机列表
        • 查询虚机绑定文件系统列表
        • 云主机挂载文件系统
        • 云主机卸载文件系统
        • 云主机备份管理
        • 云主机备份任务管理
        • 查询云主机备份任务列表
        • 云主机备份周期管理
        • 云主机备份统计
        • 备份创建一台云主机
        • 查询云主机备份状态
        • 查询云主机备份详情
        • 查询云主机备份列表
        • 删除云主机备份
        • 恢复云主机备份
        • 查看云主机备份空间占用大小
        • 云主机备份查询虚机磁盘大小
        • 云主机备份查询虚机
        • 创建云主机备份
        • 批量更新云主机备份信息
        • 更新云主机备份信息
        • 云主机备份策略管理
        • 创建云主机备份策略
        • 删除云主机备份策略
        • 修改启用停用云主机备份策略
        • 云主机立即备份
        • 备份策略绑定云主机
        • 备份策略解绑云主机
        • 云主机备份策略绑定存储库
        • 云主机备份策略解绑存储库
        • 查询云主机备份策略列表
        • 查询云主机备份策略绑定云主机信息
        • 云主机备份存储库管理
        • 退订云主机备份存储库
        • 续订云主机备份存储库
        • 查询云主机备份存储库
        • 创建云主机备份存储库
        • 扩容云主机备份存储库
        • 轻量型云主机
        • 轻量型云主机退订数据盘
        • 重装一台轻量型云主机
        • 轻量型云主机新建云硬盘
        • 创建轻量型云主机
        • 查询轻量型云主机列表
        • 查询轻量型主机详细信息
        • 续订一台包周期的轻量型云主机
        • 释放轻量型云主机
        • 查询一台轻量型云主机的Web管理终端地址
        • 开启一台轻量型云主机
        • 关闭一台轻量型云主机
        • 重启一台轻量型云主机
        • 更新一台轻量型云主机密码
        • 轻量型云主机规格套餐升级
        • 查询轻量型云主机的规格套餐资源
        • 公共接口
        • 查询虚机(云主机)规格
        • 资源池查询
        • 资源池产品可售状态查询
        • 查询账户资源池中可用区信息
        • 资源池列表查询
        • 资源池产品信息查询
        • 资源池可用区查询
        • 资源池概况信息查询
        • 用户已有资源查询
        • 用户配额查询
        • 根据订单号查询uuid
        • 新订单询价
        • 资源uuid续订询价
        • 资源uuid升级询价
        • 通用任务状态查询
        • 订单询价
        • 订单续订询价
        • 订单升级询价
        • 网络管理
        • 弹性网卡
        • 查询网卡列表
        • 查询网卡信息
        • 删除弹性公网IP
        • 创建弹性网卡
        • 删除弹性网卡
        • 修改网卡属性
        • 创建弹性公网IP
        • 网卡关联辅助私网IPs
        • 网卡解绑辅助私网IPs
        • 网卡关联多个IPv6地址
        • 网卡解绑多个IPv6地址
        • 网卡绑定云主机
        • 网卡解绑云主机
        • 安全组管理
        • 创建安全组
        • 查询用户安全组列表
        • 删除安全组
        • 创建安全组入向规则
        • 创建安全组出向规则
        • 修改安全组入方向规则
        • 修改安全组出方向规则
        • 删除安全组入方向规则
        • 删除安全组出方向规则
        • 绑定安全组
        • 解绑安全组
        • 查询用户安全组详情
        • 云主机监控
        • 查询云主机的CPU实时监控数据
        • 查询云主机的内存实时监控数据
        • 查询云主机的磁盘实时监控数据
        • 查询云主机的网卡实时监控数据
        • 查询指定时间段内的CPU监控数据
        • 查询指定时间段内的内存监控数据
        • 查询指定时间段内的磁盘监控数据
        • 查询指定时间段内的网卡监控数据
        • 云硬盘管理
        • 创建一块按量付费或包年包月云硬盘
        • 修改云硬盘属性
        • 云主机卸载云硬盘
        • 扩容云硬盘
        • 云主机挂载云硬盘
        • 释放一块包周期或按需付费的云硬盘
        • 云硬盘信息查询
        • 云助手
        • 云助手执行命令
        • 查询文件上传结果
        • 创建命令
        • 修改命令
        • 删除命令
        • 触发命令
        • 查询命令列表
        • 查询实例是否安装了云助手agent
        • 查询命令详情
        • 上传文件
        • 云助手查询结果
        • 文档下载
        • 文档下载
        • 视频专区
        • 相关协议
        • 弹性云主机产品服务协议
        • 弹性云主机服务等级协议
        • 弹性云主机产品个人信息保护声明
        • 关于禁止使用天翼云服务从事虚拟货币相关活动的声明
          无相关产品

          本页目录

          帮助中心弹性云主机最佳实践AIGC实践天翼云CPU实例部署DeepSeek-R1模型最佳实践
          天翼云CPU实例部署DeepSeek-R1模型最佳实践
          更新时间 2025-03-11 11:07:28
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2025-03-11 11:07:28
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本文介绍了英特尔®至强®处理器在AI推理领域的优势,如何使用一键部署的镜像进行纯CPU环境下基于AMX加速后的DeepSeek-R1 7B蒸馏模型推理,以及纯CPU环境下部署DeepSeek-R1 671B满血版模型实践。

          1 背景

          1.1 大模型算力需求

          大模型因其参数规模庞大、结构复杂,通常需要强大的计算资源来支持其推理过程,这使得算力成为大模型应用的核心要素。随着DeepSeek-R1模型的问世,各行各业纷纷展开了关于如何接入大模型能力的广泛调研与探索,市场对大模型推理算力的需求呈现出爆发式增长的趋势。例如在医疗、金融、零售等领域,企业迫切希望通过接入DeepSeek大模型来提升决策效率和业务能力,从而推动行业的创新发展。在这一背景下,算力的供给和优化成为推动大模型落地应用的重要因素。

          近年来,CPU制程和架构的提升以及英特尔® 高级矩阵扩展AMX(Advanced Matrix Extensions)加速器的面世带来了算力的快速提升。英特尔对大模型推理等多个AI领域持续深入研究,提供全方位的AI软件支持,兼容主流AI软件且提供多种软件方式提升CPU的AI性能。目前,已有充分的数据显示CPU完全可以用于大模型推理场景。

          1.2 CPU算力用于大模型推理的适用场景

          CPU适用于以下大模型推理场景:

          场景1: 大模型推理需要的内存超过了单块GPU的显存容量,需要多块或更高配GPU卡,采用CPU方案,可以降低成本;

          场景2: 应用请求量小,GPU利用率低,采用CPU推理,资源划分的粒度更小,可有效降低起建成本;

          场景3: GPU资源紧缺,CPU更容易获取,且可以胜任大模型推理。

          2 天翼云EMR实例DeepSeek-R1-Distill-Qwen-7B蒸馏模型部署实践

          本节内容主要介绍如何在天翼云EMR实例上,基于Intel® xFasterTransformer加速库和vllm推理引擎完成模型部署,并展示相关性能指标。

          2.1 服务部署

          为了方便用户使用,天翼云联合英特尔制作了一键部署的云主机镜像,内置DeepSeek-R1-Distill-Qwen-7B模型、vLLM推理框架、xFT加速库以及open-webui前端可视环境。您可在天翼云控制台选择下列资源池和镜像,开通云主机进行体验。

          类型 可用资源
          可用资源池 华东-华东1-az2、华东-华东1-az3
          可用规格 c8e系列(最低内存需求32G)
          可用镜像 DeepSeek-vLLM-英特尔AMX推理加速(CPU)
          image.png 

          完成云主机开通后,推理服务会在5分钟内自动启动,您无需进行任何其他操作。

          注意

          如需在云主机外访问服务,您需要绑定弹性IP,并在安全组内放行22/3000/8000端口。

          2.2 模型使用

          2.2.1 open-webui前端使用

          镜像已内置open-webui,并已完成和vllm的连接配置,可直接通过以下地址进行访问:

          http://[弹性IP]:3000/
          
          注意

          1.首次打开页面时,您需要先完成管理员注册,以进行后续的用户管理。注册数据均保存在云实例的/root/volume/open-webui目录下。

          2.如果首次打开对话页面时没有模型可供选择,请您稍等几分钟让模型完成加载即可。


          image.png

          2.2.2 vllm api调用

          镜像内置vllm服务可直接通过如下地址访问:

          # 根路径
          http://[弹性IP]:8000/
          # 查询现有模型
          http://[弹性IP]:8000/v1/models
          # 其他api接口参阅vllm文档
          
          注意

          vllm服务配置有API_KEY,您可在云实例的/root/recreate_container.sh文件开头查看到当前值,并可进行修改以确保服务安全。


          2.3 性能指标

          借助于英特尔AMX的加速能力,本推理服务能够取得显著的性能提升,天翼云完成测试并给出参考指标如下:

          基本参数

          ● vcpu数:24(物理核12)

          ● 内存:64GB

          ● 硬盘:60G 通用型SSD

          ● 模型:DeepSeek-R1-Distill-Qwen-7B(bf16)

          ● batch size:1

          ● 输入token个数:30-60

          ● 输出token个数:256

          性能数据

          平均token生成速率:

          image.png

          首token时延:

          image.png

          在天翼云c8e系列24vcpu云主机上,启用AMX加速能力后,DeepSeek 7B蒸馏模型(BF16)推理速度能够超越9token/s,满足日常使用需求。

          3 基于英特尔®至强®6处理器部署满血版DeepSeek-R1 671B实践

          3.1 性能指标

          DeepSeek R1 671B 满血版模型以其卓越的性能,为用户带来了极致的效果体验,不过其部署成本也不容小觑。若采用传统的 GPU 部署方式,需要 8 - 16 张 GPU 才能提供足够的支持,这无疑大幅增加了硬件购置、能耗以及维护等方面的成本。

          在这样的背景下,天翼云基于英特尔®提供的至强®6处理器服务器进行了DeepSeek R1 671B满血版Q4_K_M模型的部署尝试,测试结果如下:

          • 1-instance 1-socket:

          平均吞吐性能9.7~10 token/s

          • 2-instance 1-socket:

          平均7.32 token/s和7.38token/s, 共14.7token/s

          从上面测试数据可以看到,采用单实例单socket部署下,DeepSeek R1 671B满血版模型可达到平均9.7~10 token/s的吞吐量,而在双实例部署模式中,总体吞吐量提升至14.7 token/s。单颗CPU系统的吞吐性能可以达到普通用户正常使用的需要。

          3.2 英特尔®至强®6处理器简介

          英特尔®至强®CPU 为 DeepSeek R1 671B 模型的部署提供了一个极具竞争力的方案。英特尔®至强®CPU 具备支持 T 级超大内存的能力,这使得它在权重存储与加载方面表现高效。对于像 DeepSeek R1 671B 这样的超大模型,其所需的显存容量在多卡 GPU 配置下才能满足,而英特尔®至强®CPU 能够凭借其强大的内存支持能力,为该模型提供良好的运行环境。

          此外,DeepSeek R1 模型采用的 MOE(Mixture of Experts)结构,通过参数稀疏化的方式,使得在单 token 推理时仅需激活少量专家参数。这种特性显著降低了推理过程中的算力要求,与 CPU 的计算特点相契合,使得模型在 CPU 系统上的运行更加高效。这意味着在英特尔 ® 至强 ®CPU 上部署 DeepSeek R1 671B 模型,不仅能够充分发挥模型的性能优势,还能有效降低部署成本,避免了对大量 GPU 的依赖。

          如需复现以上性能测试结果,请参看附录2

          总结

          通过本次实践,无论是在天翼云EMR云实例上结合xFasterTransformer部署DS R1 distill Qwen-7B蒸馏模型,还是基于英特尔® 至强® 6处理器部署满血版DeepSeek-R1 671B模型,均验证了CPU系统在DeepSeek大模型推理上的可行性和符合业界普遍要求的性能表现。CPU系统不仅能够灵活应对不同规模的模型需求,无论是轻量化蒸馏模型还是全功能满血模型,都能高效满足用户场景需求,提供了一种低成本、经济高效的解决方案。

          附录1 英特尔® 至强® 可扩展处理器与AI加速技术

          最新英特尔® 至强® 可扩展处理器产品

          英特尔第五代® 至强® 可扩展处理器(代号 Emerald Rapids)——为AI加速而生

          第五代英特尔® 至强® 处理器以专为AI工作负载量身定制的设计理念,实现了核心架构和内存系统的双重飞跃。其64核心设计搭配高达320MB的三级缓存(每核心由1.875MB提升至5MB),相较上代缓存容量实现近三倍增长,为大规模并行AI推理提供充裕的本地数据存储空间。与此同时,处理器支持DDR5-5600高速内存,单路最大4TB的容量保证了大数据处理时的带宽和延迟优势。基于这些硬件提升,Emerald Rapids整体性能较上一代提升21%,AI推理性能平均提升42%,在大语言模型推理场景中可实现最高1.5倍的性能加速,同时大幅降低总拥有成本达77%。

          英特尔® 至强®6处理器(代号 GNR Granite Rapids)——引领CPU AI算力革新

          全新GNR处理器专为应对人工智能、数据分析及科学计算等计算密集型任务而设计。该产品在内核数量、内存带宽及专用AI加速器方面均实现重大突破:

          • 核心与性能:每CPU配备多达128个性能核心,单路核心数较上一代翻倍,同时平均单核性能提升达1.2倍、每瓦性能提升1.6倍,进一步强化了CPU在大模型推理中的独立处理能力;
          • AI加速功能:内置英特尔® 高级矩阵扩展(AMX)新增对FP16数据类型的支持,使得生成式AI和传统深度学习推理任务均能获得显著加速;
          • 内存与I/O突破:支持DDR5-6400内存及英特尔首款引入的Multiplexed Rank DIMM (MRDIMM) 技术,有效将内存带宽提升至上一代的2.3倍;同时,高达504MB的三级缓存和低延迟设计确保数据能够更快加载,为复杂模型训练和推理缩短响应时间。

          英特尔® 至强® 6处理器不仅通过更多的核心和更高的单线程性能提升了AI大模型推理能力,同时也能够作为机头CPU为GPU和其他加速器提供高速数据供给,进一步缩短整体模型训练时间。在满足混合工作负载需求的同时,其TCO平均降低30%,大模型推理加速最高可达2.4倍。

          无论是第五代至强还是全新的至强6处理器,英特尔均通过在核心架构、缓存系统、内存技术和专用AI加速器方面的全面革新,提供了业界领先的AI计算支持。这两款产品为数据中心和高性能计算平台在AI推理、训练以及多样化工作负载下提供了强大而高效的算力保障

          image.png

          英特尔全方位的AI软件生态支持

          英特尔及其合作伙伴凭借多年AI积累,围绕至强®可扩展处理器打造了完善的软件生态:广泛支持主流开源框架,通过插件优化及多样化开源工具链,使用户在x86平台上能够轻松开发、部署通用AI应用,无需手动调整,同时确保从终端到云的全程安全保护。

          此外,至强®处理器内置多种AI加速指令(如AVX-512、AMX),使得任何兼容软件均可直接调用加速功能。开发者可免费下载英特尔分发版工具、库及开发环境,充分利用这些内置加速器应对各类AI管线需求。结合多样化硬件优势与开放生态,英特尔通过经济、可扩展的方案,将AI能力无缝延伸至云端与边缘。

          其中,xFasterTransformer(xFT)是英特尔官方开源的AI推理框架,专为大语言模型在至强®平台上深度优化。xFT不仅支持多种数据精度(FP16、BF16、INT8、INT4),还能利用多CPU节点实现分布式部署,显著提升推理性能并降低成本。其简单的安装和与主流Serving框架(如vLLM、FastChat、MLServer、MindSpore Transformer、PaddlePaddle)的兼容性,帮助用户快速加速大模型应用。在3.1节中基于天翼云EMR云主机和xFasterTransformer加速引擎实现了对与DeepSeek R1蒸馏模型的高效推理部署。

          image.png

          附录2 CPU环境下部署DeepSeek-R1 671B模型实践

          环境配置

          硬件配置

          ● CPU:Intel® Xeon® 6980P Processor, 128core 2.00 GHz

          ● 内存 24*64GB DDR5-6400

          ● 存储 1TB NVMe SSD

          软件环境

          ● OS: Ubuntu 22.04.5 LTS

          ● Kernel: 5.15.0-131-generic

          ● llama.cpp: github bd6e55b

          ● cmake: 3.22.0

          ● gcc/g++: 11.4.0

          ● Python: 3.12.8

          ● git: 2.34.1

          BIOS⾥关闭sub NUMA相关配置。

          注意

          版本是指本测试中服务器上安装的版本,并⾮要求的最低版本。


          部署步骤

          1. 安装llama.cpp

          下载并安装intel oneapi库

          wget https://registrationcenter-download.intel.com/akdlm/IRC_NAS/dfc4a434-838c-4450-a6fe-2fa903b75aa7/intel-oneapi-base-toolkit-2025.0.1.46_offline.sh
          sh ./intel-oneapi-base-toolkit-2025.0.1.46_offline.sh -a --silent --cli --eula accept
          source /opt/intel/oneapi/setvars.sh
          

          下载llama.cpp推理框架源码

          git clone https://github.com/ggml-org/llama.cpp
          

          基于oneapi库对llama.cpp进行编译

          cd llama.cpp
          cmake -B build -DGGML_BLAS=ON -DGGML_BLAS_VENDOR=Intel10_64lp -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx -DGGML_NATIVE=ON
          cmake --build build --config Release -j$nproc
          

          2. 下载模型⽂件

          我们直接使用了社区制作的DeepSeek 671B满血模型的Q4量化版,您也可以下载DeepSeek官方BF16版本,并通过 llama.cpp 提供的脚本转换为 GGUF 格式。

          社区提供了从 1bit 到 8bit 不同版本的量化选项,具体区别可以参考社区网页。我们选择了使用最受欢迎的 Q4_K_M 版本。如果追求最佳效果,建议使用 Q8_0 版本。

          image.png

          image.png

          # 下载unsloth制作的社区版量化模型(注意这里要下载9个文件)
          mkdir DeepSeek-R1-Q4_K_M
          cd DeepSeek-R1-Q4_K_M
          # 建议nohup执行, 预计至少需要半天时间, 同时确保磁盘容量足够400G.
          wget https://modelscope.cn/models/unsloth/DeepSeek-R1-GGUF/resolve/master/DeepSeek-R1-Q4_K_M/DeepSeek-R1-Q4_K_M-0000{1..9}-of-00009.gguf
          

          Q4_K_M 版本的文件大小为 404.43GB,下载过程可能会比较耗时。下载完成后,您可以在 DeepSeek-R1-Q4_K_M 目录下找到一系列 .gguf 文件,例如 DeepSeek-R1-Q4_K_M-00001-of-00009.gguf。

          3. 模型加载和运⾏

          #启动模型的交互模式(替换路径地址为实际值)
          [llama.cpp路径]/build/bin/llama-cli -m [模型下载路径]/DeepSeek-R1-Q4_K_M-00001-of-00009.gguf -i
          

          下面用几个示例展现DeepSeek-R1 671B满血版强大的的reasoning推理能力:

          测试模型自我认知:

          image.png

          验证推理能⼒的经典“草莓”问题:

          image.png

          “等灯等灯”的意思:

          image.png

          4.性能及优化

          #性能测试(替换路径地址为实际值, 并根据CPU实际核数和numa情况指定-C和-m参数, 千万不要照抄!)
          export MODEL_PATH=[模型下载路径]/DeepSeek-R1-Q4_K_M-00001-of-00009.gguf
          numactl -C 0-127 -m 0 [llama.cpp路径]/build/bin/llama-cli -m $MODEL_PATH -t 128 --temp 0.6 -s 42 -no-cnv --no-kv-offload -ctk q4_0 -c 8192 -n 128 -p "<|User|>以孤独的夜行者为题写一篇750字的散文,描绘一个人在城市中夜晚漫无目的行走的心情与所见所感,以及夜的寂静给予的独特感悟。<|Assistant|>"
          

          这⾥使⽤numactl来指定使⽤单路CPU (0-127, 6980P有128核),以及这⼀路CPU的内存节点(numa0),避免跨numa传输以获取最佳性能。

          llama.cpp是本地编译的,编译的时候使⽤Intel oneAPI可以有效提升它的性能。英特尔尝试⽤了oneAPI⾥的Intel C++编译器和数学加速库MKL,结合jemalloc内存管理优化,推理速度可以达到每秒9.7~10词元(TPS, tokens per second)。

          上⾯的实验是在单路CPU上进⾏的,我们⼜在两路CPU上各⾃独⽴启动1个模型实例,总速度可以达到14.7TPS (7.32TPS+7.38TPS)。

          再进⼀步,英特尔观察到基于现有的llama.cpp软件⽅案,在CPU平台没有实现⾼效的专家并⾏和张量并⾏等优化,CPU核⼼利⽤率和带宽资源没有充分发挥出来,6980P的128核⼼运⾏1个模型还有不少性能储备。预计可以继续增加实例数来获得更好的总TPS。

          另外,通常情况下,CPU的SNC (Sub-NUMA Clustering)设置可以获得更⾼的带宽,但是受限于软件并未优化实现良好匹配,此次实验关闭了SNC测试。

          以下⽅式的系统配置也有助于提升性能:

          ● BIOS⾥关闭AMP prefetcher

          ● ⽤cpupower打开CPU的pstate性能模式

          ● 提⾼CPU的uncore频率

          ● 关闭超线程(Hyper-Threading)

          注意

          为了加快试验进度,我们限制了词元输出⻓度(-n 128)。经过验证,增加输出⻓度(例如-n 512)对于生成性能指标的影响不大。

          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  CherryStudio 协同 Ollama 启用 DeepSeek 大模型
          下一篇 :  Open WebUI 快速入门
          搜索 关闭
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明