活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      弹性云主机

      弹性云主机

        • 产品动态
        • 新手指引
        • 操作导航
        • 新手入门:购买并登录Windows弹性云主机
        • 新手入门:购买并登录Linux弹性云主机
        • DeepSeek专题
        • DeepSeek专题导航
        • 图解DeepSeek与公有云深度融合
        • 从基础设施到智能中枢:DeepSeek如何重塑公有云服务价值链
        • 高性能GPU云主机助力DeepSeek深度应用
        • 天翼云SD-WAN与DeepSeek超强联动,开启云上高效互联新时代
        • 实践指南:DeepSeek驱动高效能云生态
        • GPU云主机/弹性云主机:零基础搭建DeepSeek云端环境指南
        • 在天翼云使用Ollama运行DeepSeek的最佳实践-7B等版本
        • 基于OpenWebUI+Ollama+DeepSeek实现大模型私有知识库零代码构建的最佳实践
        • 基于DeepSeek和Chroma构建个性化知识库的最佳实践
        • 基于LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B最佳实践
        • 基于Open WebUI实现DeepSeek API调用及外部大模型API接入最佳实践
        • AnythingLLM 协同 Ollama 启用 DeepSeek 大模型最佳实践
        • CherryStudio 协同 Ollama 启用 DeepSeek 大模型
        • 天翼云CPU实例部署DeepSeek-R1模型最佳实践
        • GPU物理机:物理机搭建DeepSeek指南
        • SD-WAN跨境:SD-WAN助力DeepSeek模型定向加速
        • 智算容器:云容器引擎与DeepSeek融合实践
        • 函数计算:天翼云函数计算与DeepSeek大模型
        • Q&A:典型问题解析与策略应对
        • 产品概述
        • 产品定义
        • 术语解释
        • 产品优势
        • 弹性云主机选型
        • 功能特性
        • 产品应用场景
        • 产品使用须知
        • 产品使用限制
        • 云主机与其他服务之间的关系
        • 产品规格
        • 规格说明
        • 规格族
        • 通用云主机
        • 概述
        • 通用型
        • 计算型
        • 内存型
        • 增强型
        • 本地盘云主机
        • GPU云主机
        • 国产云主机
        • 鲲鹏系列
        • 海光系列
        • 飞腾系列
        • 经济型云主机
        • 镜像
        • 镜像类型
        • Cloud-init
        • 网络
        • 云硬盘
        • 地域和可用区
        • 购买指南
        • 计费说明
        • 计费项及其计费方式
        • 价格与折扣
        • 计费模式
        • 按量计费模式
        • 包年包月计费模式
        • 变更配置
        • 变更配置概述
        • 支持变配的实例规格
        • 云主机冷变配规则说明
        • 云主机热变配规则说明
        • 续费说明
        • 规则说明
        • 手动续订
        • 自动续订
        • 退费说明
        • 规则说明
        • 退费流程
        • 包周期按量互转
        • 成本优化
        • 计费FAQ
        • 快速入门
        • 注册账号
        • 创建弹性云主机
        • 登录Linux弹性云主机
        • 登录Windows弹性云主机
        • 初始化数据盘
        • 入门实践
        • 修订记录
        • 用户指南
        • 云主机实例
        • 实例生命周期
        • 查看实例
        • 查看实例状态
        • 查看实例详情
        • 导出实例信息
        • 搜索实例
        • 登录实例
        • 登录Windows弹性云主机实例
        • Windows弹性云主机登录方式概述
        • Windows弹性云主机控制中心远程登录(VNC方式)
        • 远程桌面连接(MSTSC方式)
        • 在Linux主机上登录Windows云主机
        • 在移动设备上登录Windows云主机
        • Mac OS系统登录Windows云主机
        • 登录Linux弹性云主机实例
        • Linux弹性云主机登录方式概述
        • Linux弹性云主机远程登录(VNC方式)
        • SSH密钥方式登录
        • SSH密码方式登录
        • 在移动设备上登录Linux云主机
        • Mac OS系统登录Linux云主机
        • 管理远程登录用户
        • 管理实例属性
        • 修改实例名称
        • 修改主机名称(hostname)
        • 批量设置有序的实例名称或主机名称
        • 修改实例描述
        • 更改实例时区
        • 开启和关闭实例保护功能
        • 配置主机名与IP地址的映射
        • 实例自定义数据注入
        • 实例自定义元数据
        • 管理实例状态
        • 开机实例
        • 关机实例
        • 重启实例
        • 重装操作系统
        • 变更规格
        • 创建相同配置实例
        • 克隆实例
        • 管理云主机组
        • 安装驱动和工具包(可选)
        • NVIDIA驱动安装指引
        • 创建配备GPU驱动的GPU云主机(Linux)
        • 安装GRID驱动
        • 卸载GRID驱动
        • 安装Tesla驱动
        • 卸载Tesla驱动
        • 使用可信云主机
        • 云主机启动模版
        • 创建云主机启动模版
        • 查看云主机启动模版
        • 修改云主机启动模版
        • 使用云主机启动模版创建云主机
        • 删除云主机启动模版
        • 云主机镜像
        • 镜像概述
        • 通过镜像创建云主机
        • 通过云主机创建Windows私有镜像
        • 通过云主机创建Linux私有镜像
        • 镜像更多操作
        • 云硬盘
        • 云硬盘概述
        • 创建云硬盘
        • 挂载数据盘
        • 卸载数据盘
        • 扩容云硬盘
        • 加密云硬盘
        • 云硬盘加密概述
        • 管理加密云硬盘
        • 随主机释放设置
        • 弹性IP
        • 弹性IP概述
        • 绑定弹性IP
        • 解绑弹性IP
        • 更换弹性IP
        • 修改弹性IP带宽
        • 使用SNAT访问公网
        • 密码和密钥对
        • 密码
        • 密码使用场景介绍
        • 在控制台重置密码
        • 密钥对
        • 密钥对使用场景介绍
        • 在控制台创建密钥对
        • 导入密钥对
        • 为云主机绑定/更换密钥对
        • 为云主机解绑密钥对
        • 网卡
        • 弹性网卡概述
        • 创建弹性网卡
        • 管理弹性网卡
        • 修改弹性网卡基本信息、分配IPv6、辅助私网IP
        • 如何修改内网IP、切换VPC
        • 开启网卡多队列功能
        • 虚拟IP概述
        • IPv6带宽
        • 云主机备份
        • 备份弹性云主机
        • 文件系统
        • 一键挂载文件系统
        • 监控
        • 监控弹性云主机
        • 监控Agent概览
        • 监控Agent版本说明
        • 安装监控Agent
        • 云主机支持的操作系统监控指标(安装监控Agent)
        • 设置告警规则
        • 查看监控指标
        • 安全
        • 提升云主机安全的方法
        • 服务的访问控制
        • 安全组
        • 安全组概述
        • 安全组配置示例
        • 配置安全组规则
        • 修改安全组规则
        • 更改安全组
        • 数据保护技术
        • Hypervisor安全
        • 用户加密
        • 重点操作短信二次验证
        • 验证规则
        • 开启重点操作短信验证
        • 关闭重点操作短信验证
        • 故障恢复
        • 云服务器CTIAM
        • 统一身份认证IAM介绍
        • 通过IAM用户控制资源访问
        • 迁移
        • 迁移云主机实例
        • 迁移本地盘云主机数据
        • 运维
        • 云助手
        • 云助手产品介绍
        • 安装云助手客户端
        • 购买指南
        • 创建命令
        • 免登录执行命令
        • 查看命令执行结果
        • 查看和执行公共命令
        • 上传文件
        • 查看文件上传结果
        • 资源与标签
        • 标签管理
        • 标签概述
        • 标签设计原则及示例
        • 绑定标签
        • 使用标签筛选资源
        • 解绑标签
        • 云主机服务委托
        • 配额调整
        • 云主机快照
        • 云主机快照管理
        • 云主机快照策略
        • 常见问题
        • 高频常见问题
        • 地域与可用区类
        • 如何选择地域?
        • 地域之间是否存在差异?
        • 已购买的弹性云主机,是否支持更换地域?
        • 什么是可用区,怎样选择可用区?
        • 可用区之间的数据传输是否需要收费?
        • 是否可以将应用的不同组件分散部署到不同的地域?
        • 是否提供应用灾备的相关服务?
        • 是否可以在不同的地域之间实施应用灾备?
        • 如何获取弹性云主机的物理机房位置?
        • 购买与退订冻结相关问题
        • 弹性云主机提供哪些计费方式,区别是什么?
        • 同一台云主机是否同时支持两种计费方式?
        • 是否支持更改已有云主机的计费方式?
        • 账户里面有余额,为什么无法创建按量付费云主机?
        • 弹性云主机关机后还会继续计费吗?
        • 一个账户最多可以创建多少按量付费的云主机?
        • 如何选择适合业务的云主机实例?
        • 购买实例时,资源已经售罄怎么办?
        • 什么是ARM CPU架构与X86 CPU架构?
        • 控制台无法看到云主机,如何处理?
        • 如何处理支付订单后云主机开通失败?
        • 申请开通弹性云主机需要多久?
        • 什么情况下弹性云主机会被冻结,冻结后怎么办?
        • 如何退订弹性云主机?
        • 已到期资源如果续订,续订周期如何计算?
        • 是否支持账户余额变动提醒?
        • 弹性云主机怎样停止计费?
        • 创建与删除
        • 创建类
        • 删除类
        • 登录与连接
        • VNC登录类
        • VNC方式登录后,播放音频文件没有声音怎么办?
        • 如何修改Windows弹性云主机的分辨率
        • 怎样修改远程登录的端口?
        • 修改Linux弹性云主机的默认SSH端口后,使用新端口无法登录?
        • 使用 VNC远程登录,想要复制本地字符发送到虚机中,发现一次性无法达到描述的3000个字符
        • VNC方式登录弹性云主机后,较长时间不操作,界面无响应怎么办
        • 控制台登录类
        • VNC方式登录弹性云主机时,登录界面显示乱码怎么办?
        • 通过控制台登录弹性云主机时提示1006或1000怎么办?
        • VNC方式登录弹性云主机时,系统黑屏输入无反应?
        • VNC方式登录弹性云主机后,查看数据失败,VNC无法正常使用?
        • 登录前准备类
        • 使用创建时的用户名和密码无法SSH方式登录云主机
        • 远程登录时需要输入的帐号和密码是什么
        • 弹性云主机登录前准备工作有哪些
        • 远程登录忘记密码怎么办
        • 远程连接类
        • MSTSC方式登录Windows 2012的弹性云主机,登录失败怎么办?
        • Windows 2012系统卸载某些软件后无法进入系统桌面怎么办?
        • 远程登录弹性云主机时,对浏览器版本的要求?
        • 使用私有镜像创建Windows弹性云主机时设置的密码不生效怎么办?
        • 弹性云主机实例出现了异地登录怎么办
        • 无法远程登录Windows云主机怎么办
        • 无法远程登录Linux云主机怎么办
        • 规格变更类
        • 弹性云主机怎样变更规格
        • 国产化云主机变配有什么限制
        • 主机升配后CPU的ID是否会变化
        • Windows弹性云主机变更规格后磁盘脱机怎么办?
        • Linux弹性云主机变更规格后磁盘脱机怎么办?
        • 弹性云主机变配操作无法成功提交
        • 使用故障类
        • 弹性云主机使用时有什么限制
        • 宿主机故障时,弹性云主机是否能自动恢复
        • 如何处理管理控制台异常提示信息
        • 如何修改弹性云主机(Windows)的SID
        • Windows弹性云主机没有声音
        • 弹性云主机配置的邮件无法正常发送
        • 使用free -m命令查询弹性云主机内存大小与实际配置不符
        • linux虚机内关键文件路径
        • 鲲鹏、海光、飞腾系列云主机挂载云硬盘和弹性网卡异常
        • 操作系统管理
        • 图形化系统安装类
        • 云主机是否有图形界面
        • CentOS 7系列弹性云主机如何安装图形化界面
        • CentOS 8系列弹性云主机如何安装图形化界面
        • Ubuntu系列弹性云主机如何安装图形化界面
        • Debian系列弹性云主机安装图形化界面流程
        • 操作系统故障类
        • 针对Intel处理器芯片存在的Meltdown和Spectre安全漏洞,应该如何规避?
        • 如何开启CentOS操作系统的SELinux功能?
        • 怎样查看GPU加速型云主机的GPU使用率?
        • Linux弹性云主机如何升级内核?
        • 用户自持镜像导致的弹性云主机操作系统无法正常启动是什么原因?
        • 文件系统损坏,Linux弹性云主机启动失败
        • 文件系统checkfs使用 fsck 工具检查并修复文件系统
        • 重装操作系统
        • 重装弹性云主机时是否可以选择其他操作系统
        • 重装操作系统需要多长时间?
        • 用户能否自己安装或者升级操作系统
        • 重装/切换操作系统/变更规格对磁盘数据有影响吗
        • 文件上传/数据传输
        • 使用FTP上传文件时写入失败、文件传输失败
        • WinSCP无法连接到Linux云主机
        • Windows云主机搭建了FTP,通过公网无法访问
        • 使用FTP上传文件时客户端连接服务端超时
        • 本地Windows主机通过MSTSC上传文件到Windows云主机
        • 本地Windows主机使用对象存储上传文件到Windows云主机
        • 本地Windows主机使用WinSCP上传文件到Linux云主机
        • 本地MacOS系统主机上传文件到Windows云主机
        • 本地Linux主机使用SCP上传文件到Linux云主机
        • 本地Linux主机使用SFTP上传文件到Linux云主机
        • 本地Windows主机使用FTP上传文件到Windows/Linux云主机
        • 本地Linux主机使用FTP上传文件到Linux云主机
        • 怎样在本地主机和Windows云主机之间互传数据?
        • FTP服务器上的文件夹因权限访问出错怎么办?
        • 迁移云服务器
        • 弹性云主机可以迁移到其他地域/帐号吗?
        • 镜像源管理
        • 内网yum源及NTP配置
        • Windows或Linux操作系统镜像怎么选
        • 常见docker源配置指导
        • 磁盘管理类
        • 磁盘分区与虚拟内存类
        • 磁盘扩容类
        • 卸载云硬盘操作指南及故障排除
        • 其它
        • 密码与密钥对类
        • 密码
        • 云主机默认密码是多少?
        • 忘记天翼云账号密码怎么办?
        • 如何在控制台重置弹性云主机密码?
        • 如何在操作系统内部修改云主机密码?
        • 用户创建弹性云主机成功后远程登录提示密码错误?
        • 一键重置密码后无法使用新密码登录弹性云主机
        • 用户未修改密码,正常使用弹性云主机一段时间后无法登录
        • 如何关闭Selinux?
        • 密钥对
        • 如何创建密钥对?
        • 如何使用密钥对?
        • 密钥对无法下载
        • 无法导入密钥对
        • 怎样查询弹性云主机使用的密钥对是哪个?
        • 已开云主机是否还支持使用密钥对?
        • 如何在云主机上使用安装USB类型的Ukey秘钥?
        • 弹性云主机中使用cloudbase-init是什么?
        • Python升级导致Cloud-init不工作
        • 使用密钥文件无法正常登录Linux弹性云主机
        • 通过puttygen.exe工具创建的密钥对,导入管理控制台失败
        • 网络配置类
        • 弹性IP类
        • DNS与NTP配置类
        • 配置DNS
        • 怎样配置弹性云主机的DNS和NTP信息?
        • 网卡类
        • 弹性云主机添加网卡后是否会自动启动?
        • 怎样修改云主机的VPC网段、子网的网段?
        • 路由类
        • iptables如何配置、建议配置规则指导
        • 访问网站或应用故障类
        • 其它类
        • 云主机mac是否为固定的?
        • DHCP无法正常获取内网IP?
        • 如何查看、修改Linux弹性云主机的内核参数?
        • 端口映射配置
        • 如何查看云主机的mac地址?
        • 不同帐号下弹性云主机内网是否可以互通?
        • 我购买的云主机是否在同一子网?
        • 云主机网络优化方案
        • 如何排查带宽超过限制
        • 安全类
        • 怎么设置云主机密码可以在一定程度上提升云主机安全
        • 安全组和安全规则配额是多少
        • 安全组加规则报错:参数错误,请检查你的参数
        • 如何关闭重点操作短信验证
        • 弹性云主机上是否可以搭建数据库
        • 如何保护弹性云主机安全
        • 如何防止实例被暴力破解
        • 云主机卡顿
        • Windows云主机卡顿
        • Linux云主机卡顿
        • 数据库应用
        • 弹性云主机是否支持Oracle数据库?
        • 云主机快照常见问题
        • 监控类
        • 云主机无监控数据如何处理
        • 如何重启监控Agent
        • 监控Agent自动退出如何处理
        • 产品咨询类
        • 怎样注册天翼云
        • 弹性云主机可以做什么
        • 私有数据是否支持物理邮寄
        • 升级CPU、内存、带宽时是否需要关机
        • Linux虚机product_uuid参数是否可以修改
        • 香港节点的云主机是否可以实现与国内云主机互通
        • 云主机windows 2019操作系统对应普通电脑哪个操作系统
        • 其它类
        • 云助手常见问题
        • 故障修复
        • 高频故障案例
        • Linux操作系统执行passwd命令重置密码失败提示:Authentication token manipulation error
        • 云主机错误状态及解决方案
        • 如何解决云平台创建云主机状态错误
        • 云主机端口不通怎样排查?
        • 云主机网络延迟和丢包,如何定位
        • 弹性云主机启动缓慢
        • ping不通或丢包时如何进行链路测试?
        • 云主机带宽占用高怎么办
        • Linux系统云主机如何自查病毒及中病毒后处理建议
        • Windows系统云主机如何自查病毒及中病毒后处理建议
        • 操作系统类(Windows)
        • 云主机时间与标准时间不一致
        • Windows弹性云主机蓝屏如何处理
        • Windows弹性云主机配置双网卡外网访问
        • Windows无法正常启动时怎样恢复数据?
        • 如何查看Windows云主机的登录日志?
        • CentOS设置系统时区
        • 启动Tomcat时报错,提示80端口被占用怎么办?
        • 怎样实现Windows云主机文件共享?
        • 输入法无法使用怎么办?
        • windows操作系统下卸载云硬盘操作指南及故障排除
        • 怎样设置Windows弹性云主机首选语言
        • Windows云主机配置文件共享和网络磁盘映射方法
        • Windows云主机如何保持会话连接长时间不断开?
        • Windows弹性云主机不能复制粘贴内容?
        • 云主机错误状态处理方式
        • 弹性云主机配置的邮件无法正常发送
        • 如何解决云平台创建云主机状态错误
        • 云主机错误状态及解决方案
        • 操作系统类(Linux)
        • 弹性云主机新内核启动失败如何设置使用第二内核启动
        • 为什么操作系统实际版本和购买时的镜像版本不一致?
        • 怎样配置Linux分析工具:atop和kdump
        • Ubuntu操作系统如何设置默认启动内核
        • Linux操作系统云主机安装Docker支持的操作系统版本
        • 弹性云主机IP地址丢失处理方法
        • 内核参数kernel.unknown_nmi_panic配置错误导致Linux弹性云主机异常重启
        • pip安装软件时出现错误:command ´gcc´ failed with exit status 1
        • CentOS云主机根目录设置成777权限后如何恢复?
        • Linux弹性云主机执行命令或启动服务时出现错误:Cannot allocate memory
        • 无法编辑fstab文件怎么办
        • 非root用户切root用户时,连接超时怎么办?
        • Web访问超时且系统日志打印:nf_conntrack: table full, dropping packet
        • 修改/etc/security/limits.conf文件,重启后不生效怎么办?
        • emergency mode(紧急模式)问题处理方法
        • 使用taskset命令让进程运行在指定CPU上
        • 弹性云主机中/etc/rc.local开机启动脚本不生效怎么办?
        • 网络配置
        • resolv文件被重置怎么办?
        • Linux系统重启后/etc/hosts自动添加主机名解析
        • CentOS 7重启后dhclient未运行,导致无法获取IP
        • Linux系统使用多网卡时网卡名称出现漂移
        • 同一子网的两块网卡均绑定弹性公网IP
        • 远程连接报错
        • 远程连接云主机出现蓝屏
        • 远程连接Windows云主机报错:出现身份验证错误,要求的函数不受支持
        • 天翼云Windows云主机远程连接时出现报错: 此计算机无法连接到远程计算机
        • 远程连接Windows云主机报错:没有远程登录的权限
        • 登录Windows云主机提示“内部错误”怎么办?
        • 远程连接Windows云主机报错:无法验证此远程计算机的身份
        • Windows云主机远程连接时出现报错:RDP连接断开,出现内部错误
        • Windows云主机远程连接时出现报错:您的连接已丢失
        • Windows云主机报错:您的凭据无法工作
        • 磁盘空间管理
        • Linux操作系统云主机中buffer和cache占用内存怎么办?
        • Linux文件系统提示:Read-only file system
        • Linux操作系统云主机磁盘分区提示空间不足怎么办?
        • 文件已经删除,但空间未释放怎么办?
        • Inode节点耗尽导致无法创建新文件问题处理
        • Linux如何创建swap分区/swap文件
        • GPU驱动故障
        • GPU驱动异常怎么办?
        • GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办?
        • GPU设备显示异常
        • T4 GPU设备显示异常
        • G系列弹性云主机GPU驱动故障
        • GPU驱动不可用
        • SSH连接
        • /etc/passwd文件损坏导致云主机登录失败怎么办?
        • 怎样设置允许或禁止用户/IP通过SSH连接云主机?
        • Linux启动sshd服务出现/var/empty/sshd无法访问的解决方案
        • CentOS 7修改SSH默认端口后无法连接怎么办?
        • 开启UseDNS导致SSH连接缓慢怎么办?
        • 怎样禁用SSH密码方式连接云主机?
        • 怎样长时间保持SSH会话连接不断开?
        • 多用户登录
        • 配置多用户登录后,普通用户登录闪屏怎么办?
        • Windows云主机如何配置多用户登录?(Windows 2008)
        • 多用户登录Windows主机时无法打开浏览器
        • Windows云主机如何配置多用户登录?(Windows 2012)
        • 密码与密钥对
        • Linux 云主机怎样切换密钥登录为密码登录?
        • Linux云主机如何进入单用户模式重置root密码
        • 密钥对方式购买的弹性云主机,使用私钥文件获取登录密码失败
        • 使用密钥文件无法正常登录 Linux 弹性云主机
        • 如何更换密钥对
        • Linux云主机重置密码
        • 无法导入密钥对
        • 安装IIS服务
        • 怎样做网页定向?
        • IIS服务修改已绑定的网站域名
        • Windows云主机上安装IIS服务
        • 最佳实践
        • 创建云主机最佳实践
        • 为Windows Server添加AD、DHCP、DNS、IIS服务
        • 基于Tomcat构建Java web环境(CentOS 7.4)
        • Mysql数据库自建,使用,问题排查最佳实践
        • 典型网站类场景
        • 镜像部署Windows环境
        • 麒麟系统云主机配置图形化界面
        • 下载并安装SQL Server
        • 线下OpenStack环境导入公有云环境
        • 创建双栈云主机
        • 弹性云主机配置
        • 弹性云主机之间迁移最佳实践
        • Linux服务器SSH登录的安全加固
        • 使用VNC Viewer连接Linux云主机
        • Linux系统进入单用户模式
        • 修改云主机默认远程端口
        • 设置Windows操作系统首选语言
        • ECS安全组实践(入方向规则)
        • 针对云主机的最佳实践
        • 搭建微信公众号后台
        • 网站性能测试的最佳实践
        • 网络性能测试的最佳实践
        • 网站搭建指导
        • 手动部署Java Web
        • 基于天翼云ECS搭建Oracle RAC集群
        • 手动搭建LNMP环境
        • 快速构建FTP站点(Linux)
        • 快速构建FTP站点(Windows)
        • 搭建FTP
        • 手工部署RabbitMQ(CentOS 7.4)
        • 在天翼云上配置NTP服务器
        • 跨账号同区域迁移云主机
        • 手工搭建Ghost博客(Ubuntu 20.04)
        • 手工安装宝塔面板(CentOS7.2)
        • 通过配置监控Agent实现指定进程监控
        • 快速部署SD-WAN vCPE最佳实践
        • 部署Palworld幻兽帕鲁服务器最佳实践
        • 部署Palworld幻兽帕鲁服务器最佳实践(Ubuntu)
        • 部署Palworld幻兽帕鲁服务器最佳实践(Windows)
        • Palworld幻兽帕鲁世界参数修改最佳实践(Ubuntu)
        • Palworld幻兽帕鲁世界参数修改最佳实践(Windows)
        • Palworld幻兽帕鲁更新游戏最佳实践
        • 已有天翼云Ubuntu云主机,搭建幻兽帕鲁服务器
        • 已有天翼云Windows云主机,搭建幻兽帕鲁服务器
        • 大模型学习机最佳实践
        • 一键部署与登录Llama 3/Llama 2大模型学习机
        • 部署与登录Llama 3/Llama 2大模型学习机
        • 已有天翼云云主机,部署与登录Llama 3/Llama 2大模型学习机
        • 修改大模型学习机登录密码
        • 大模型学习机服务启停最佳实践
        • 大模型学习机图像生成最佳实践
        • 大模型学习机文本生成最佳实践
        • 大模型学习机文本生成模型微调最佳实践
        • 使用大模型学习机微调自己的文本生成模型
        • 使用大模型学习机微调自己的图像生成模型
        • AIGC实践
        • 在天翼云使用Ollama运行DeepSeek的最佳实践-7B等版本
        • 在天翼云使用vLLM运行DeepSeek的最佳实践-32B等版本
        • 基于DeepSeek和Chroma构建个性化知识库的最佳实践
        • 基于OpenWebUI+Ollama+DeepSeek实现大模型私有知识库零代码构建的最佳实践
        • 基于LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B最佳实践
        • 基于CPU的AI推理加速技术在天翼云EMR云主机上的应用
        • 基于Open WebUI实现DeepSeek API调用及外部大模型API接入最佳实践
        • AnythingLLM 协同 Ollama 启用 DeepSeek 大模型最佳实践
        • CherryStudio 协同 Ollama 启用 DeepSeek 大模型
        • 天翼云CPU实例部署DeepSeek-R1模型最佳实践
        • Open WebUI 快速入门
        • 天翼云 GPU 云主机构建高性能 Deepseek 集群最佳实践-32B等版本
        • 使用云主机启动模版快速部署DeepSeek的最佳实践
        • 弹性伸缩搭配GPU云主机水平扩展最佳实践
        • 基于Anything LLM实现云主机外挂Embedding模型、向量数据库的最佳实践指南
        • Open WebUI及vLLM版本升级最佳实践
        • API参考
        • 调用前必知
        • 概述
        • 终端节点
        • 请求状态码
        • 状态枚举值
        • API概览
        • 如何调用API
        • 认证鉴权
        • 构造请求
        • Python调用示例
        • API
        • 2022-09-09
        • 新版
        • 云主机生命周期管理
        • 删除云主机及释放关联资源
        • 全部操作云主机
        • 创建相同配置的云主机
        • 批量释放云主机
        • 克隆云主机
        • 创建一台按量付费或包年包月的云主机
        • 批量创建按量付费或包年包月云主机
        • 续订一台包周期的云主机
        • 释放云主机
        • 云主机添加共享网卡
        • 节省关机一台云主机
        • 节省关机多台云主机
        • 开启一台云主机
        • 关闭一台云主机
        • 销毁一台包周期已退订云主机
        • 重启一台云主机
        • 重装一台云主机
        • 开启多台云主机
        • 关闭多台云主机
        • 重启多台云主机
        • 重装多台云主机
        • 云主机查询
        • 查询云主机支持的冷变配规格信息
        • 根据masterOrderID查询云主机ID
        • 查询一个异步任务的结果
        • 查询用户云主机统计信息
        • 查询云主机支持的热变配规格信息
        • 查询云主机的云硬盘列表
        • 查询用户云硬盘统计信息
        • 查询GPU云主机驱动版本
        • 查询云主机的WEB管理终端地址
        • 查询云主机的固定IP
        • 获取多台云主机的状态信息
        • 查询云主机列表
        • 查询一台或多台云主机详细信息
        • 查询一台云主机详细信息
        • 查询多个异步任务的结果
        • 查询一台云主机的自定义数据
        • 查询指定规格族下的云主机信息
        • 查询云主机规格族列表
        • 查询一个或多个云主机规格资源
        • 云主机修改信息
        • 编辑云主机标签
        • 批量绑定解绑云主机标签
        • 云主机热变配
        • 更新云主机的部分信息
        • 更新多台云主机的部分信息
        • 更新云主机密码
        • 更新云主机实例删除保护信息
        • 更新多台云主机的密码
        • 云主机修改带宽或规格
        • 云主机修改规格
        • 云主机修改带宽
        • 云主机委托管理
        • 云主机清除委托
        • 云主机绑定委托
        • 云主机组管理
        • 删除云主机组
        • 更新云主机组信息
        • 云主机组批量移除云主机
        • 云主机加入主机组校验
        • 云主机组中删除单台云主机
        • 云主机组中添加单台云主机
        • 创建云主机组
        • 查询云主机组内的云主机
        • 查询云主机所在云主机组
        • 查询云主机组列表或者详情
        • 快照管理
        • 快照任务管理
        • 查询云主机快照任务列表
        • 批量删除云主机快照
        • 快照策略管理
        • 修改云主机快照策略
        • 停用云主机快照策略
        • 创建云主机快照策略
        • 启用云主机快照策略
        • 快照策略绑定云主机
        • 快照策略解绑云主机
        • 查询云主机快照任务列表
        • 查询云主机快照策略列表
        • 查询云主机快照策略详情
        • 查询快照策略绑定云主机列表
        • 立即执行云主机快照策略
        • 删除云主机快照策略
        • 快照创建一台云主机
        • 云主机快照个数统计
        • 查询云主机快照详情
        • 云主机快照状态
        • 查询云主机快照列表
        • 删除云主机快照
        • 批量更新云主机快照信息
        • 更新云主机快照信息
        • 创建云主机快照
        • 恢复云主机快照
        • 密钥对管理
        • 绑定SSH密钥对到Linux云主机
        • 查询一个或多个密钥对
        • 创建一对SSH密钥对
        • 导入RSA密钥对
        • 删除SSH密钥对
        • 为云主机解绑SSH密钥对
        • 元数据管理
        • 批量删除云主机元数据
        • 云主机元数据创建
        • 云主机元数据查询
        • 云主机元数据更新
        • 云主机元数据删除
        • 文件系统
        • 查询文件系统关联虚机列表
        • 查询虚机绑定文件系统列表
        • 云主机挂载文件系统
        • 云主机卸载文件系统
        • 云主机备份管理
        • 云主机备份任务管理
        • 查询云主机备份任务列表
        • 云主机备份周期管理
        • 云主机备份统计
        • 备份创建一台云主机
        • 查询云主机备份状态
        • 查询云主机备份详情
        • 查询云主机备份列表
        • 删除云主机备份
        • 恢复云主机备份
        • 查看云主机备份空间占用大小
        • 云主机备份查询虚机磁盘大小
        • 云主机备份查询虚机
        • 创建云主机备份
        • 批量更新云主机备份信息
        • 更新云主机备份信息
        • 云主机备份策略管理
        • 创建云主机备份策略
        • 删除云主机备份策略
        • 修改启用停用云主机备份策略
        • 云主机立即备份
        • 备份策略绑定云主机
        • 备份策略解绑云主机
        • 云主机备份策略绑定存储库
        • 云主机备份策略解绑存储库
        • 查询云主机备份策略列表
        • 查询云主机备份策略绑定云主机信息
        • 云主机备份存储库管理
        • 退订云主机备份存储库
        • 续订云主机备份存储库
        • 查询云主机备份存储库
        • 创建云主机备份存储库
        • 扩容云主机备份存储库
        • 轻量型云主机
        • 轻量型云主机退订数据盘
        • 重装一台轻量型云主机
        • 轻量型云主机新建云硬盘
        • 创建轻量型云主机
        • 查询轻量型云主机列表
        • 查询轻量型主机详细信息
        • 续订一台包周期的轻量型云主机
        • 释放轻量型云主机
        • 查询一台轻量型云主机的Web管理终端地址
        • 开启一台轻量型云主机
        • 关闭一台轻量型云主机
        • 重启一台轻量型云主机
        • 更新一台轻量型云主机密码
        • 轻量型云主机规格套餐升级
        • 查询轻量型云主机的规格套餐资源
        • 公共接口
        • 查询虚机(云主机)规格
        • 资源池查询
        • 资源池产品可售状态查询
        • 查询账户资源池中可用区信息
        • 资源池列表查询
        • 资源池产品信息查询
        • 资源池可用区查询
        • 资源池概况信息查询
        • 用户已有资源查询
        • 用户配额查询
        • 根据订单号查询uuid
        • 新订单询价
        • 资源uuid续订询价
        • 资源uuid升级询价
        • 通用任务状态查询
        • 订单询价
        • 订单续订询价
        • 订单升级询价
        • 网络管理
        • 弹性网卡
        • 查询网卡列表
        • 查询网卡信息
        • 删除弹性公网IP
        • 创建弹性网卡
        • 删除弹性网卡
        • 修改网卡属性
        • 创建弹性公网IP
        • 网卡关联辅助私网IPs
        • 网卡解绑辅助私网IPs
        • 网卡关联多个IPv6地址
        • 网卡解绑多个IPv6地址
        • 网卡绑定云主机
        • 网卡解绑云主机
        • 安全组管理
        • 创建安全组
        • 查询用户安全组列表
        • 删除安全组
        • 创建安全组入向规则
        • 创建安全组出向规则
        • 修改安全组入方向规则
        • 修改安全组出方向规则
        • 删除安全组入方向规则
        • 删除安全组出方向规则
        • 绑定安全组
        • 解绑安全组
        • 查询用户安全组详情
        • 云主机监控
        • 查询云主机的CPU实时监控数据
        • 查询云主机的内存实时监控数据
        • 查询云主机的磁盘实时监控数据
        • 查询云主机的网卡实时监控数据
        • 查询指定时间段内的CPU监控数据
        • 查询指定时间段内的内存监控数据
        • 查询指定时间段内的磁盘监控数据
        • 查询指定时间段内的网卡监控数据
        • 云硬盘管理
        • 创建一块按量付费或包年包月云硬盘
        • 修改云硬盘属性
        • 云主机卸载云硬盘
        • 扩容云硬盘
        • 云主机挂载云硬盘
        • 释放一块包周期或按需付费的云硬盘
        • 云硬盘信息查询
        • 云助手
        • 云助手执行命令
        • 查询文件上传结果
        • 创建命令
        • 修改命令
        • 删除命令
        • 触发命令
        • 查询命令列表
        • 查询实例是否安装了云助手agent
        • 查询命令详情
        • 上传文件
        • 云助手查询结果
        • 文档下载
        • 文档下载
        • 视频专区
        • 相关协议
        • 弹性云主机产品服务协议
        • 弹性云主机服务等级协议
        • 弹性云主机产品个人信息保护声明
        • 关于禁止使用天翼云服务从事虚拟货币相关活动的声明
          无相关产品

          本页目录

          帮助中心弹性云主机最佳实践AIGC实践基于CPU的AI推理加速技术在天翼云EMR云主机上的应用
          基于CPU的AI推理加速技术在天翼云EMR云主机上的应用
          更新时间 2025-02-12 09:11:03
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2025-02-12 09:11:03
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本文介绍了英特尔® 至强®处理器在AI推理领域的优势,以及如何使用一键部署的镜像进行推理性能测试。

          1. 背景

          1.1 大模型算力需求

          大模型因其参数规模巨大、结构复杂,通常需要强大的计算资源来支持其推理过程,这使得算力成为大模型应用的关键要素。信通院的数据资料显示云端推理的市场潜力很大,AI大模型落地应用数量正在不断增加,市场对大模型推理算力的需求也呈现爆发式增长态势。

          近年来,CPU制程和架构的提升以及英特尔AMX指令集的面世带来了算力的快速提升。英特尔对大模型推理等多个AI领域持续深入研究,提供全方位的AI软件支持,兼容主流AI软件且提供多种软件方式提升CPU的AI性能。目前,已有充分的数据显示CPU可以用于大模型推理。

          1.2 CPU算力用于大模型推理的适用场景

          CPU适用于以下大模型推理场景,

          场景1: 大模型推理需要的内存超过了单块GPU的显存容量,需要多块或更高配GPU卡,采用CPU方案,可以降低成本;

          场景2: 应用请求量小,GPU利用率低,采用CPU推理,资源划分的粒度更小,可有效降低起建成本;

          场景3: GPU资源紧缺,CPU更容易获取,且可以胜任大模型推理。

          2. 英特尔 AI推理加速技术

          2.1 英特尔 AI硬件基础

          第三代英特尔® 至强® 可扩展处理器(Ice Lake ) :

          最大支持40个物理核,最大支持内存频率3200MT/s,最大支持64条PCIe 4.0。

          搭载英特尔® 高级矢量扩展 512(英特尔® AVX-512)技术。

          可用:天翼云第七代云主机(s7/c7/m7)。

          第四代英特尔® 至强® 可扩展处理器(Sapphire Rapids ) :

          最大支持60个物理核,最大支持内存频率4800MT/s,最大支持80条PCIe 5.0。

          搭载英特尔® 高级矩阵扩展 (Advanced Matrix eXtensions)技术。

          AMX 支持BF16和INT8,通过加速矩阵乘法运算,极大提升AI应用的性能。

          可用:天翼云第八代云主机(s8r)。

          第五代英特尔® 至强® 可扩展处理器(Emerald Rapids ) :

          最大支持64个物理核,最大支持内存频率5600MT/s,L3 cache高达5MB/core,最大支持80条PCIe 5.0。

          搭载英特尔® 高级矩阵扩展 (Advanced Matrix eXtensions)技术。

          AMX 支持BF16和INT8,通过加速矩阵乘法运算,极大提升AI应用的性能。

          相较于第四代处理器,第五代处理器具有更大的带宽,在大语言模型推理领域可带来最高1.5倍的性能提升。

          可用:天翼云第八代云主机(c8e)。

          2.2 英特尔 AI软件工具

          英特尔提供三个层面的AI软件支持:

          image.png

          2.2.1 Intel® Extension for PyTorch*

          Intel® Extension for PyTorch*(旧称Intel PyTorch Extension, IPEX)能够优化AI推理任务在英特尔硬件上的性能,支持AVX-512与AMX。

          2.2.2 xFasterTransformer

          xFasterTransformer(xFT)是由英特尔官方开源的AI推理框架,为大语言模型(LLM)在英特尔®至强®硬件平台上提供了一种深度优化的解决方案。xFT支持AVX-512与AMX,并可在AMX上获得极致的推理性能。xFT目前支持的接口与模型如下:

          image.png

          (更新时间:2024-04-09)

          xFT还可支持多种数据类型,满足用户对不同精度的需求。xFT目前支持的数据类型包括:

          FP16 / BF16 / INT8 / W8A8 / INT4 / NF4 /
          BF16_FP16 / BF16_INT8 / BF16_W8A8 / BF16_INT4 / BF16_NF4 / W8A8_INT8 /
          W8A8_INT4 / W8A8_NF4(更新时间:2024-04-09)

          xFT部署简便,您只需要一键安装插件,并在程序中加入几行代码,即可使用xFT对您的模型进行加速。具体实践可参考本文第3节的内容。

          3. 英特尔 AI软件工具在天翼云主机上的应用实践

          本节内容主要介绍基于Intel® Extension for PyTorch*与xFasterTransformer,能够在天翼云主机上取得的性能指标,以及具体实施方法。

          3.1 AI推理性能指标

          3.1.1 LLaMA2性能指标

          基本参数

          • vcpu数:32
          • 内存:64GB
          • 硬盘:通用型SSD
          • 模型:Llama-2-7b-chat
          • 输入token个数:128
          • 输出token个数:128
          • batch size:1
          • 数据类型:torch2.0(BF16),xFT(FP16)
          • 测试机型:c7.8xlarge.2 | 32核 | 64G (numa node 1),s8r.8xlarge.2 | 32核 | 64G (numa node 2)

          性能数据

          image.png

          image.png

          xFT在推理总时延(Inference Latency)和生成token时延(Next Token Latency)上都有明显的优化。

          3.1.2 StableDiffusion性能指标

          基本参数

          • vcpu数:32
          • 内存:64GB
          • 硬盘:通用型SSD
          • 模型:stable-diffusion-2-1
          • 输入token个数:6
          • 输出图片尺寸:512 x 512
          • 推理Steps:20
          • batch size:1
          • 数据类型:torch2.0(FP32),IPEX(FP32)

          性能数据

          IPEX在推理总时延上有一定的性能提升。

          image.png

          3.1.3 EMR云主机LLM性能指标

          注意

          在天翼云EMR云主机正式上线后,我们更新性能指标如下。

          基本参数

          • vcpu数:16
          • 内存:64GB
          • 硬盘:通用型SSD
          • 输入token个数:128
          • 输出token个数:128
          • batch size:1
          • 数据类型:torch2.0(BF16),xFT(BF16)

          性能数据

          image.png

          xFT在生成token时延(Next Token Latency)上有明显的优化,在16vcpu的机型上能使用主流3B规格模型达到低于80ms/token的生成速度,足以满足业界需求。

          3.1.4 EMR云主机StableDiffusion性能指标

          注意

          在天翼云EMR云主机正式上线后,我们更新性能指标如下。

          基本参数

          • vcpu数:16
          • 内存:64GB
          • 硬盘:通用型SSD
          • 模型:stable-diffusion-2-1
          • 输入token个数:<16
          • 推理Steps:20
          • batch size:1
          • 数据类型:torch(FP32),IPEX(FP32)

          性能数据

          image.png

          IPEX在推理总时延上有一定的提升,在本示例16vcpu和20steps配置下能够将256x256大小图片生成时延压缩到10秒内,512x512大小图片生成时延压缩到35秒内,具有一定的实用价值。

          3.2 AI软件工具实施方法(基于一键部署镜像)

          为了方便您进行性能测试,天翼云联合英特尔制作了一键部署的云主机镜像,内置torch2.0环境,Intel® Extension for PyTorch*与xFasterTransformer软件,以及Llama-2-7b-chat与stable-diffusion-2-1模型。您可直接开通云主机并选择对应镜像进行体验。

          镜像支持的云主机规格与资源池信息如下表:

          注意

          内存需在32G及以上。

          云主机规格 资源池
          英特尔第三代至强可扩展处理器AVX-512 s7 / c7 / m7 西南-西南1 华东-华东1
          英特尔第四代至强可扩展处理器AMX s8r 华东-华东1 -可用区2
          英特尔第五代至强可扩展处理器AMX c8e 华东-华东1 -可用区2
          注意

          镜像内置的是天翼云七代主机(s7/c7/m7)特殊编译版本的xfastertransformer,如果您使用的是天翼云八代机(s8r),请在xFT环境下手动更新安装新版本,否则版本不兼容,可参考下方的示例代码。

          conda activate xFT
          pip install xfastertransformer==1.4.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
          

          镜像名称:应用镜像 - ubuntu - Intel-AI推理加速,如图所示:

          image.png

          3.2.1 xFasterTransformer (xFT)实施方法

          3.2.1.1 模型转换为xFT格式

          在使用xFT框架前,需要对模型进行格式转换。xFT提供了转换命令,您可修改和执行/root/tools/xft_trans.py脚本。

          import xfastertransformer as xft
          # 输入huggingface模型路径
          HF_DIR ="/root/models/Llama-2-7b-chat-hf"
          # 输出xft模型路径
          XFT_DIR ="/root/models/Llama-2-7b-chat-xft"
          xft.LlamaConvert().convert(HF_DIR, XFT_DIR)
          
          在执行前, 需要进入conda运行环境(执行过一次即可)
          conda activate xFT
          python xft_trans.py
          

          3.2.1.2 查看numa节点分布

          numactl -H
          

          以下输出代表32个vcpu均在同一个numa node下:

          image.png

          以下输出代表vcpu0-15分布在numa node0, vcpu16-31分布在numa node1:

          image.png

          3.2.1.3 检查测试参数

          性能测试所需的参数均在、root/tools/llama_benchmark.py中,您可按需进行修改,对比开启和关闭xFT的效果,以及不同token长度的效果等。

          image.png

          3.2.1.4 单进程执行

          注意

          如果您的云主机存在不止一个numa node,直接使用单进程方式执行脚本会出现大幅性能波动,您可参考单核和多核的不同实施方法。

          在单进程情况下,您可直接执行python脚本:

          # 在执行前, 需要进入conda运行环境(执行过一次即可)
          conda activate xFT
          cd /root/tools
          # 绑定cpu核, 性能更稳定
          # OMP线程数和绑定的cpu核数保持一致
          # 天翼云主机开启了cpu超线程, 0-1/ 2-3号vcpu分别在同一个物理核上, 只需要使用其中一个核即可
          # vcpu与物理核的对应关系可在/proc/cpuinfo查看每个processor的physical id
          OMP_THREAD_NUM=16 numactl --all -C 0,2,4,6,8,10,12,14,16,18,20,22,24,26,28,30 python llama_benchmark.py
          

          您将会得到以下输出(本示例采用天翼云c7.8xlarge.2 | 32核 | 64G云主机):

          image.png

          如果想要和加速前的性能进行对比,您可以修改脚本内的USE_XFT=False,然后再次执行。

          您也可使用测试脚本查看模型生成的结果:

          # 在执行前, 需要进入conda运行环境(执行过一次即可)
          conda activate xFT
          cd /root/tools
          # 修改prompt后执行
          python llama_run.py
          

          3.2.1.5 多进程执行

          在多numa node场景下, 推荐使用多进程获得更好的性能指标。您需要根据上文3.2.1.2节 numactl -H查到的信息,调整/root/tools/llama_benchmark_multirank.sh脚本中的相关内容。具体信息在脚本中均有详细注释。

          注意

          当前多进程脚本只支持USE_XFT=True的模式,关闭xFT加速时无法利用多进程。

          # 在执行前, 需要进入conda运行环境(执行过一次即可)
          conda activate xFT
          cd /root/tools
          bash llama_benchmark_multirank.sh
          

          在numa node分配正确的情况下, 天翼云s8r.8xlarge.2 | 32核 | 64G云主机可达到如下指标:

          image.png

          对比来看,如果此时坚持使用单进程模式,带来了跨numa node的性能损耗,则只能达到如下指标:

          image.png

          可以明显看到性能下降。

          3.2.2 Intel® Extension for PyTorch*(IPEX)实施方法

          OPEX的应用和性能测试可直接按单进程执行:

          # 在执行前, 需要进入conda运行环境(执行过一次即可)
          conda activate ipex
          python sd_benchmmark.py
          

          您将会得到如下输出:

          image.png

          如果想要和加速前性能进行对比,可以修改脚本内的USE_IPEX=False然后再次执行。

          4. 附录:一键部署的镜像环境制作
          ########## base environment ##########
          # 选择一个miniconda版本下载安装: https://repo.anaconda.com/miniconda/
          wget https://repo.anaconda.com/miniconda/Miniconda3-py310_24.1.2-0-Linux-x86_64.sh
          bash Miniconda3-py310_24.1.2-0-Linux-x86_64.sh
          source ~/.bashrc
          # 安装numactl工具
          apt install numactl
          # 安装git lfs
          curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
          apt-get install git-lfs
          git lfs install
          ########## xFasterTransformer ##########
          conda create -n xFT python=3.10
          conda activate xFT
          pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cpu
          pip install transformers==4.36.0 sentencepiece protobuf accelerate datasets cmake -i https://pypi.tuna.tsinghua.edu.cn/simple
          # icelake AVX-512架构 (特殊编译版本)
          pip install xfastertransformer-1.3.1.icx-py3-none-any.whl
          # spr/emr AMX架构 (当前最新版本为1.4.0)
          pip install xfastertransformer==1.4.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
          # 从huggingface下载llama-2-7b-chat模型
          
          ########## Intel® Extension for PyTorch* ##########
          pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu
          pip install intel-extension-for-pytorch
          pip install oneccl_bind_pt --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/cpu/us/
          
          pip install transformers accelerate diffusers
          
          # 从huggingface下载stable-diffusion-2-1模型
          # 注意sd模型仓库内放了太多不同版本的模型,实际只需要下载其中一版即可。
          # 只下载小文件
          GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/stabilityai/stable-diffusion-2-1
          # 然后根据需要下载所需文件
          cd stable-diffusion-2-1
          git lfs pull --include=”pytorch_model.bin”
          git lfs pull --include=”diffusion_pytorch_model.bin”
          
          # /root/tools/stable_diffusion_ipex/pipeline.py下载来自https://github.com/huggingface/diffusers/blob/main/examples/community/stable_diffusion_ipex.py
          
          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  基于LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B最佳实践
          下一篇 :  基于Open WebUI实现DeepSeek API调用及外部大模型API接入最佳实践
          搜索 关闭
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明