云主机开年特惠28.8元/年,0元秒杀等你来抢!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 天翼云新春焕新季 NEW 云主机开年特惠28.8元/年,0元秒杀等你来抢!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      EasyCoding敏捷开发平台_相关内容
      • TeleDB管控平台架构
        本页介绍天翼云TeleDB数据库的管控平台架构。 分布式数据库管控平台架构如图所示。 管控平台支持集群部署,基于etcd选出主从,当主节点故障时自动进行主从切换。 说明 etcd是一个分布式、高可用、一致的键值存储数据库,用于保存关键数据,并提供访问。其应用场景广泛包括但不限于服务发现、共享配置、协调分布式工作和分布式锁等。 所有的管控操作均由主节点进行,访问从节点相同的接口会转发到主节点。 etcd会记录管理节点、配置库以及实例节点的集群信息,用于第三方仲裁。 每一台实例机器要且仅要部署一个agent,它负责管理一台服务器上的所有实例节点。 管控平台对实例的管理均通过agent进行,包括启停、升级、扩容、高可用等。
        来自:
        帮助文档
        分布式融合数据库HTAP
        私有云产品
        技术白皮书
        方案简介
        TeleDB管控平台架构
      • Snapckpt- CheckPoint 加速
        SnapCheckpoint(Snapckpt)是由息壤一体化智算服务平台 一站式智算服务平台提供的针对大模型训练场景提供的高性能checkpoint框架。Snapckpt提供了高效便捷的断点存储、加载机制。 Snapckpt加速包 SnapCheckpoint(Snapckpt)是由息壤一体化智算服务平台 一站式智算服务平台提供的针对大模型训练场景提供的高性能checkpoint框架。Snapckpt提供了高效便捷的断点存储、加载机制。 Snapckpt介绍 Snapckpt是一种为大模型训练打造的易用、可拓展、高性能的断点解决方案。Snapckpt提供了高效便捷的断点存储、加载机制,其主要有以下几大优势: 1. 异步断点保存:通过优化断点保存流程,使得断点保存过程异步化,尽可能减小断点保存过程对于训练的中断,减少训练阶段耗时。 2. 分布式断点存储:对模型机优化器参数进行分布式存储,避免集中式存储带来的额外通信开销,大幅降低存储与加载断点的耗时。 3. 多框架支持:支持MegatronLM、Deepspeed两大主流大模型训练框架。 4. 简单易用:安装及使用方式简单,用户仅需简单步骤即可使用,提升使用效率。 背景信息 在大规模分布式模型训练过程中,系统可能因硬件故障或软件异常导致训练中断。为确保训练进度可恢复,业界普遍采用周期性保存检查点(Checkpoint)的方案。值得注意的是,检查点操作耗时与模型参数量呈正相关关系,当面对参数量达百亿甚至千亿级别的大模型时,每次检查点保存往往需要耗费数分钟至十余分钟不等。特别是在使用MegatronLM框架或原生PyTorch进行训练时,检查点保存过程会强制暂停训练任务,导致宝贵的计算资源被闲置。因此,开发高效的检查点机制以降低时间成本和资源浪费,已成为当前大规模模型训练亟待解决的关键问题。 Snapckpt采用多阶段异步断点存储机制,降低断点存储耗时,减少训练中断带来的影响,从而提升训练速度,提升计算资源有效利用率。
        来自:
        帮助文档
        一站式智算服务平台
        用户指南
        智算加速
        Snapckpt- CheckPoint 加速
      • 热点数据存储
        业务场景 一般是现有系统已经存在瓶颈,热点查询业务首先迁移到缓存。数据的变更还是在数据库,对新的业务系统不透明。 业务要求 数据由其他可靠性存储设备保存,缓存只保存热点数据 通过设置缓存失效时间来保证缓存更新 缓存数据不存在则重新获取 增加数据核对工具异步刷新缓存 需求分析 1. 建立用户、建立redis数据分区、建立访问分区,选择热点存储模版(刷盘策略、主从同步策略不一样); 2. 建立环境后,建立分组(表),根据开发示例验证分组可用; 3. 缓存API使用可以参考开发示例代码; 4. 使用api设置缓存key超时时间; 5. 缓存使用加载可以参考热key的缓存构建; 6. 使用定时任务扫描数据源获取增量更新数据修改缓存或者在数据变更事件发送的业务代码处更新缓存。 需要注意的问题:缓存穿透 可靠性存储的方案 若配置数据对数据一致性要求较高或者热点变化非常频繁可以考虑可靠性存储场景来设计,但此方案需要业务数据的修改透明,能整体迁移到缓存。如下缓存部分的设计将变的简单 业务要求: 数据由缓存保存,不允许丢失。 需求分析:配置类数据可以整体当次热点数据,存放在缓存,简化系统架构方案 建立redis数据分区,选择持久化存储模版(刷盘策略、主从同步策略不同); 缓存API使用可以参考开发示例代码。
        来自:
        帮助文档
        分布式缓存服务Redis版
        最佳实践
        热点数据存储
      • 应用场景
        数据脱敏与水印 数据共享 交换灵活策略 为了确保数据安全,数据提供方需要按照需求方的实际用途对数据进行脱敏处理并添加水印信息。在数据开放时,提供方需要筛选出可开放字段,对不可开放字段进行脱敏处理。可通过数据脱敏与水印基于用户业务情况制定不同的脱敏策略,灵活遮蔽、清洗各类敏感数据。 开发测试环境 规避风险 在业务系统开发测试过程中,为确保数据质量存在直接引用生产数据的情况。可通过数据脱敏与水印一致性脱敏算法,将生产数据经过脱敏处理后导入开发测试环境,在保证数据的“真实性”的同时规避生产数据泄漏的风险。 共享数据泄漏 溯源追责 当数据被共享给第三方后,第三方有责任对数据进行有效保护。可通过数据脱敏与水印将三方单位信息、共享时间等信息以数据水印的方式嵌入到共享数据中。一旦发生数据泄漏,用户只需提供少量的泄漏数据样本就可以通过嵌入的水印信息溯源泄漏源头,明确责任方并采取相应的追责措施。 数据分析计算 隐私保护 数据脱敏与水印支持保留计算特征的脱敏方式,在剔除数据敏感性的同时最大程度保留AI建模相关数据的可用性。可通过数据脱敏与水印对个人识别信息进行脱敏处理,可完成数据去标识化且不影响统计分析结果,确保个人隐私安全。
        来自:
        帮助文档
        数据安全专区
        产品介绍
        应用场景
      • 计费常见问题
        边缘安全加速平台—安全与加速服务的计费项有哪些? 边缘安全加速平台安全与加速计费由三个部分构成:基础套餐+套餐外超量费用+扩展服务。 基础套餐(必选):您可以根据需求,购买不同规格套餐获得相应标准的安全与加速服务,具体请见安全与加速基础套餐资费。 套餐外超量费用(超量计费):如果套餐内流量/带宽等用尽,可订购资源包或者开通按需,具体计费请参考安全与加速套餐超出资费。 扩展服务(可选):如果套餐内包含的能力不能满足您的需求,如需要增加域名数等,您可以选择订购扩展服务,具体计费请参考安全与加速扩展服务资费。 如何申请免费试用边缘安全加速平台? 边缘安全加速平台暂时不支持官网自助开通试用,如果您需要开通试用,请通过提交工单给天翼云客服,天翼云技术支持将会为您开通。 如何关闭边缘安全加速平台安全与加速服务或停止计费? 开通边缘安全加速平台安全与加速服务后,只要不添加域名,就不会产生计费。 如果您已经添加了域名,您可以登录边缘安全加速控制台,进入接入管理域名接入域名管理页面,可参考以下方式停止计费: 停用域名:对域名进行停用操作后,天翼云接入层CNAME将立刻解析至不可访问地址。请参见停用域名。 删除域名:删除按钮只能在域名状态为“已停止”时可见,请参见删除域名。
        来自:
        帮助文档
        边缘安全加速平台
        常见问题
        计费常见问题
      • 规格限制
        功能 规格限制 说明 函数个数 20个 单个用户账号允许发布的函数个数 开发语言 JavaScript(ES6) 运行时支持的开发语言,后续会陆续扩展更多语言。 代码包大小 5MB 用户函数代码文件大小上限 CPU运行时间 支持10ms、50ms、100ms 指单次请求运行用户函数的CPU耗时,该耗时不包括等待IO的时间 内存 128MB 单次请求运行用户函数的内存占用 响应时间 30s 单次请求运行用户函数的响应时间 子请求 6个 单次请求运行用户函数允许发出fetch子请求的数量 重定向次数 暂不支持重定向 请求URL 64KB 用户函数接收终端用户请求的URL长度,超过则返回494状态码 请求标头 64KB 用户函数接收终端用户单个请求标头大小不大于64KB,超过则返回494状态码 请求标头总大小不大于256KB,超过则返回414状态码
        来自:
        帮助文档
        边缘安全加速平台
        开发者平台
        规格限制
      • 服务测试
        服务测试功能可以让您在控制台填写调用参数、发起服务调用,并得到服务调用的结果 服务测试 在日常开发中,开发人员或测试人员需要临时调用线上服务来调试已经部署的服务或查询线上数据。服务测试功能可以让您在控制台填写调用参数、发起服务调用,并得到服务调用的结果。 登录微服务治理中心控制台,在左侧导航栏选择微服务治理中心>开发测试治理>服务测试,在测试列表可以查看已开启的微服务应用的相关信息,包括服务名称、应用名称、实例数量等。 选择需要测试的服务,点击测试,在选择测试方法面板中设置测试相关参数,包括调用IP、Path、请求方法、测试参数,然后单击执行,在结果区域查看测试是否成功。 参数说明: 参数 说明 调用IP 选中服务的提供者ip。 Path 方法请求路径。 请求方法 支持GET、POST、PUT和DELETE。 测试参数 方法请求携带的请求数据,包含headers和params。示例:{"headers": {"source":"inner"},"params": {"username":"test"}} GET:headers代表请求头、params代表请求参数。 POST:headers代表请求头、params代表请求体。 PUT:headers代表请求头、params代表请求体。 DELETE:headers代表请求头、params代表请求参数。
        来自:
        帮助文档
        微服务引擎
        用户指南
        微服务治理中心
        开发测试治理
        服务测试
      • 边缘安全加速平台零信任服务隐私政策
        本文提供了天翼云边缘安全加速平台零信任服务隐私政策(详细版)查看地址。 天翼云边缘安全加速平台零信任服务隐私政策(详细版),详情请参见这里。
        来自:
        帮助文档
        边缘安全加速平台
        相关协议
        边缘安全加速平台零信任服务隐私政策
      • 其它平台解析域名无缝迁移(平滑迁移)
        本小节介 云解析其它平台解析域名无缝迁移至云解析(平滑迁移)最佳实践。 提供域名解析的服务商都要求修改DNS,但修改DNS是存在解析中断的风险的。为了避免风险,凡计划使用云解析的用户,我们建议用户做如下操作。 准备工作 1. 联系原DNS服务商导出解析记录。 2. 从云解析平台下载《导入解析记录模板》,按模板填写要求,将整理后的解析记录类型为A、AAAA、CNAME的记录填写在模板中。 1. 登录云解析平台,在“记录管理”界面,点击页面右上方“域名设置”进入域名设置界面。界面最下方为“解析记录批量操作”功能模块。 2. 点击“下载模板”下载《导入解析记录模板》。 3. 根据模板格式填写主机名、记录类型、线路类型、记录值、TTL等信息。 操作步骤 1. 通过天翼云购买解析服务。 2. 在天翼云控制中心找到云解析产品列表,点击“解析管理”进入域名维护页面。 1. 在“记录管理”界面,点击页面右上方“域名设置”进入域名设置界面。 2. 将《导入解析记录模板》数据批量导入云解析平台。点击“上传文件”将填写好的模板文件上传至平台,平台将根据操作情况反馈上传结果。 3. 手动添加无法批量导入的解析记录。 3. 检查解析记录是否同原数据一致,避免遗漏。 4. 修改DNS。解析记录设置完成后,需要到域名所在注册商处,将DNS修改为云解析指定的DNS服务器。 5. 等待解析生效。预计4872小时完成缓存刷新,这是由于各地Localdns服务器的域名缓存失效时间长短不一,需要等各地Localdns服务器主动来更新该域名最新DNS服务器地址,才可逐步实现全网生效。 6. 在缓存刷新的4872小时内,DNS解析仍有可能向原DNS发起DNS查询,所以原DNS服务商中的解析记录数据建议保留一周后删除。
        来自:
        帮助文档
        云解析
        最佳实践
        其它平台解析域名无缝迁移(平滑迁移)
      • 到期与欠费说明
        关停加速服务 1、登录边缘安全加速控制台进行停用操作,域名点击停用后,天翼云接入层CNAME将立刻解析至不可访问地址。对域名进行停用操作后,控制台上域名状态将变更为“已停止”。 2、边缘安全加速平台套餐内默认包含一些流量,若套餐流量用尽,边缘安全加速平台安全与加速服务将会停止加速服务,将CNAME入口解析至客户源站地址,对域名进行停用操作后,控制台上域名状态将变更为“已停止”。 3、边缘安全加速平台客户退订套餐或套餐到期,边缘安全加速平台安全与加速服务会立即将加速域名的CNAME入口解析至客户源站地址,控制台上域名状态将变更为“已停止,1天后将加速域名的CNAME解析至不可用地址。 恢复服务 对域名进行停用操作后,CDN节点虽会删除配置,但仍会在系统数据库中保留原来的配置记录,客户可通过账户充值结清欠款,并对域名进行【启用】操作,边缘安全加速平台即可恢复服务。操作步骤如下: 1. 登录边缘安全加速控制台。 2. 单击左侧导航栏【域名】【域名管理】。 3. 在域名列表页面,找到【已停止】的域名,单击【操作】列的【启用】。 4. 对弹出的【启用确认】,单击【确认启用】。
        来自:
        帮助文档
        边缘安全加速平台
        计费说明
        到期与欠费说明
      • CDM Job
        参数 是否必选 说明 CDM集群名称 是 选择待执行的CDM作业所属的CDM集群。此处支持勾选两个CDM集群,用于提升作业可靠性。 勾选两个集群后,第一个勾选的集群为主集群,第二个勾选的集群为备集群。作业会默认运行在主集群上,当主集群状态异常后,会触发切换到备集群运行作业。 勾选两个集群的场景下,“作业类型”不推荐选择“创建新作业”,应设置为“选择已存在的作业”,且确保主备集群下分别存在该作业。您可以在主集群新建CDM作业并导出,然后再导入作业到备集群,实现作业同步,具体操作方法请参见 CDM作业类型 是 选择已存在的作业。 创建新作业。 说明 如果作业类型为“选择已存在的作业”,当CDM作业有修改时,此处作业节点不会同步更新。如需更新此作业节点,需要重新保存该节点所在的作业,用于触发CDM作业更新。 如果作业类型为“创建新作业”,节点运行时会检测是否有同名CDM作业。 如果CDM作业未运行,则按照请求体内容更新同名作业。 如果同名CDM作业正在运行中,则等待作业运行完成后更新该作业。在此期间该作业可能被其他任务启动,可能会导致数据抽取不符合预期(如作业配置未更新、运行时间宏未替换正确等),因此请注意不要创建多个同名作业。 CDM作业名称 否 仅当“作业类型”为“选择已存在的作业”时需要配置该参数。选择待执行的CDM作业。 如果此CDM作业使用了在数据开发时配置的作业参数或者变量,则后续在数据开发模块调度此节点,可以间接实现CDM作业根据参数变量进行数据迁移。 CDM作业消息体 否 仅当“作业类型”为“创建新作业”时需要配置该参数。此处需要填写CDM作业JSON。方便起见可以在CDM已有作业处选择操作“更多 > 查看作业JSON”,复制其中的JSON内容,在此处修改适配。 如果此CDM作业使用了在数据开发时配置的作业参数或者变量,则后续在数据开发模块调度此节点,可以间接实现CDM作业根据参数变量进行数据迁移。 节点名称 是 节点名称,可以包含中文、英文字母、数字、“”、“”、“/”、“<”、“>”等各类特殊字符,长度为1~128个字符。
        来自:
        帮助文档
        数据治理中心 DataArts Studio
        用户指南
        数据开发
        节点参考
        CDM Job
      • 安全加速产品升级
        本文说明安全加速产品升级情况。 尊敬的天翼云客户: 因业务调整,从2024年12月1日起,天翼云安全加速产品将并入边缘安全加速平台,边缘安全加速平台安全与加速服务可提供提供动静态加速、DDoS防护、Web防护、Bot管理和API安全能力,相比于安全加速的应用场景更丰富。 新购客户:2024年12月1日起,将无法订购安全加速产品。如需订购,请订购其升级产品边缘安全加速平台安全与加速服务。 存量客户:安全产品将持续提供服务至您当前订单周期结束,但从2024年12月1日起,将无法进行续订和变更。如需续订,请订购其升级产品边缘安全加速平台安全与加速服务;如需变更,请先退订安全加速产品,再通过订购边缘安全加速平台的安全与加速服务服务来满足您的需求。 如有任何问题,请您随时通过在线客服或服务热线4008109889联系我们,我们将竭诚为您服务。 感谢您对天翼云的支持! 天翼云服务团队
        来自:
        帮助文档
        安全加速(文档停止维护)
        产品公告
        安全加速产品升级
      • 产品动态
        本文说明应用加速产品升级情况。 尊敬的天翼云客户: 因业务调整,从2024年12月1日起,天翼云应用加速产品将并入边缘安全加速平台,边缘安全加速平台边缘接入服务可提供应用加速和边缘DDoS防护能力,相比于应用加速的应用场景更丰富。 新购客户:2024年12月1日起,将无法订购应用加速产品。如需订购,请订购其升级产品边缘安全加速平台边缘接入服务。 存量客户:应用加速产品将持续提供服务至您当前订单周期结束,但从2024年12月1日起,将无法进行续订和变更。如需续订,请订购其升级产品边缘安全加速平台边缘接入服务;如需变更,请先退订应用加速产品,再通过订购边缘安全加速平台的边缘接入服务来满足您的需求。 更多边缘安全加速平台信息详见: 如有任何问题,请您随时通过在线客服或服务热线4008109889联系我们,我们将竭诚为您服务。 感谢您对天翼云的支持! 天翼云服务团队
        来自:
        帮助文档
        应用加速(文档停止维护)
        产品动态公告
        产品动态
      • 数据备份与恢复
        本页介绍天翼云TeleDB数据库数据备份与恢复。 ‌数据库备份与‌恢复是确保数据安全的关键措施,通过定期备份数据库可以防止数据丢失或损坏。备份类型包括全量备份、‌增量备份,每种类型都有其特定的应用场景和优势。 TeleDB支持物理备份、物理备份与恢复、逻辑备份和逻辑备份与恢复。 物理备份可参考《TeleDB数据库管理平台使用手册》中备份与恢复 章节中 物理备份 。 物理备份恢复可参考《TeleDB数据库管理平台使用手册》中备份与恢复 章节中 物理备份恢复 。 逻辑备份可参考《TeleDB数据库管理平台使用手册》中备份与恢复 章节中逻辑备份。 逻辑备份恢复可参考《TeleDB数据库管理平台使用手册》中备份与恢复 章节中逻辑备份恢复。
        来自:
        帮助文档
        分布式融合数据库HTAP
        私有云产品
        安全配置手册
        数据备份与恢复
      • RBAC 授权
        本节介绍RBAC授权。 RBAC 介绍 Kubernetes RBAC能力的授权,可以让不同的用户或用户组拥有操作不同Kubernetes资源的权限。Kubernetes RBAC API定义了四种类型:Role、ClusterRole、RoleBinding与ClusterRoleBinding,这四种类型之间的关系和简要说明如下: Role:角色,其实是定义一组对Kubernetes资源(命名空间级别)的访问规则。 RoleBinding:角色绑定,定义了用户和角色的关系。 ClusterRole:集群角色,其实是定义一组对Kubernetes资源(集群级别,包含全部命名空间)的访问规则。 ClusterRoleBinding:集群角色绑定,定义了用户和集群角色的关系。 Role和ClusterRole指定了可以对哪些资源做哪些动作,RoleBinding和ClusterRoleBinding将角色绑定到特定的用户、用户组或ServiceAccount上。如下图所示。 在分布式容器云平台控制台可以授予用户或用户组命名空间权限,可以对某一个命名空间或全部命名空间授权,产品控制台提供如下预置的ClusterRole。 受限人员:对集群命名空间级别控制台可见资源对象的只读权限。 开发人员:对集群命名空间级别控制台可见资源对象的读写权限。 运维人员:对集群命名空间级别资源对象的读写权限,对其他资源对象的只读权限。 管理员权限:对所有集群资源对象的读写权限。 服务资源权限(IAM授权)与Kubernetes RBAC权限的关系 服务资源权限(IAM授权)主要覆盖分布式云容器平台系统功能 和 系统资源(比如注册集群、舰队、集群联邦)的权限管理,而Kubernetes RBAC权限仅针对该集群的Kubernetes资源生效。
        来自:
        帮助文档
        分布式容器云平台 CCE One
        用户指南
        平台服务
        权限配置
        RBAC 授权
      • 支持多种配置规格
        云硬盘规格 适用场景 普通IO 不常访问的工作负载,例如日常办公应用和轻载型开发测试等。 高IO 一般访问量的工作负载,例如普通开发测试和对存储容量和性能有平衡诉求的办公应用。 通用型SSD 高性价比的云硬盘,适合中等性能诉求的企业应用,例如大型开发测试、转码类业务、Web服务器日志和高性能系统盘等。 超高IO 适用于高IOPS、大带宽需求的读写密集型应用场景,例如高性能计算和IO密集时延敏感型数据库等。 极速型SSD 适用于超高IOPS、超大带宽和超低时延的应用场景,例如大型OLTP数据库、大型NoSQL数据库以及核心关键业务系统等。 XSSD0 容量与性能可解耦,适用于高吞吐和低时延的应用场景,例如中小型数据库、中小规模ELK日志集群。 XSSD1 容量与性能可解耦,适用于超高吞吐和超低时延的应用场景,例如超大带宽的读写密集型场景、中大型数据库。 XSSD2 容量与性能可解耦,适用于超高IOPS、超高吞吐量和超低时延的应用场景,例如高负载、核心关键业务系统、超大型数据库。 XSSD3 容量与性能可解耦,适用于极高性能场景,例如超大型OLTP数据库使用。
        来自:
        帮助文档
        云硬盘 EVS
        产品介绍
        功能特性
        支持多种配置规格
      • 边缘安全加速平台学术加速隐私政策
        本文提供了天翼云边缘安全加速平台学术加速隐私政策。 天翼云边缘安全加速平台学术加速隐私政策(详细版),详情请参见这里。
        来自:
        帮助文档
        边缘安全加速平台
        相关协议
        边缘安全加速平台学术加速隐私政策
      • 可靠性增强
        本章节主要介绍天翼云大数据平台 翼MapReduce服务的可靠性增强特性。 天翼云大数据平台 翼MapReduce是天翼云在Apache Hadoop基础上推出的一站式开源大数据平台产品,具备大数据基础存储计算平台和大数据运维管理平台,主要在大数据组件的可靠性、性能调优等方面进行了优化和提升。 系统可靠性 管理节点均实现HA Hadoop开源版本的数据、计算节点基于分布式系统进行设计,单节点故障不影响系统整体运行;而以集中模式运作的管理节点可能出现的单点故障,就成为整个系统可靠性的短板。 天翼云大数据平台 翼MapReduce对所有组件的管理节点都提供了类似的双机的机制,包括HDFS NameNode、HiveServer2、HBase HMaster、YARN ResourceManager、KerberosServer、OpenLDAPServer等,全部采用主备或负荷分担配置,有效避免了单点故障场景对系统可靠性的影响。 异常场景下的可靠性保证 通过可靠性分析方法,梳理软件、硬件异常场景下的处理措施,提升系统的可靠性。 保障意外掉电时的数据可靠性,不论是单节点意外掉电,还是整个集群意外断电,恢复供电后系统能够正常恢复业务,除非硬盘介质损坏,否则关键数据不会丢失。 硬盘亚健康检测和故障处理,对业务不造成实际影响。 自动处理文件系统的故障,自动恢复受影响的业务。 自动处理进程和节点的故障,自动恢复受影响的业务。 自动处理网络故障,自动恢复受影响的业务。 节点可靠性
        来自:
        帮助文档
        翼MapReduce
        产品介绍
        功能特性
        可靠性增强
      • 设置网站白名单
        本文将向您介绍如何通过边缘安全加速平台安全与加速服务提供的访问控制功能设置网站白名单。 功能介绍 若存在您完全信任的请求,支持在边缘安全加速平台控制台配置网站白名单策略,符合条件的请求将不经过安全与加速服务任意的防护策略。 背景信息 您的域名接入边缘安全加速平台安全与加速服务后,配置防护策略将默认作用于所有符合策略的请求,若您希望某类请求不经过某个防护策略,可以分别配置对应的白名单功能。 若您希望请求针对任意防护策略加白,可以配置网站白名单,配置详情可见下文。 若防护规则集中的某条规则出现误报情况,可以配置规则白名单,配置详情可见设置Web规则白名单。 若您希望请求针对Bot防护策略加白,可以配置Bot策略白名单,配置详情可见Bot策略白名单。 前提条件 已经订购边缘安全加速平台安全与加速服务,若未订购,请参见服务开通。 在控制台新增域名,请参见添加服务域名。 开通高级版及以上版本,支持使用访问控制功能。 操作步骤 1. 登录边缘安全加速平台控制台。 2. 在左侧导航栏中选择【安全能力】,进入【访问控制/限流】菜单,并在左侧域名列表选择您要防护的域名。 3. 进入防护能力高级安全防护【访问控制】详细设置。
        来自:
        帮助文档
        边缘安全加速平台
        安全与加速
        安全
        防护白名单
        设置网站白名单
      • 配置OCSP Stapling
        本文简述OCSP Stapling功能的概念、使用前提和配置方法。 功能介绍 OCSP(Online Certificate Status Protocol)即在线证书状态协议,是一种互联网协议,用于验证SSL证书的有效性,以确保它未被吊销。开启OCSP Stapling功能后,将由边缘安全加速平台安全与加速服务器完成OCSP信息的查询工作。边缘安全加速平台安全与加速服务器通过较低频率的查询,将结果缓存到本地服务器中(默认缓存时间1小时)。当客户端与边缘安全加速平台安全与加速服务器进行TLS握手时,边缘安全加速平台安全与加速服务务器将本地缓存的OCSP信息以及证书一起发送给客户端,供客户端验证,客户端无需再查询数字证书认证机构(CA),极大地节省了客户端验证证书有效性的时间。 注意事项 使用OCSP Stapling功能前需先开启HTTPS。 OCSP Stapling功能默认关闭。 OCSP Stapling功能默认缓存1个小时,缓存过期后第一个访问请求OCSP Stapling不生效。 确保您的客户端支持OCSP扩展字段,如客户端不支持OCSP扩展字段,则此功能不生效。 配置了HTTPS加速的域名,可启用或者关闭OCSP Stapling功能,删除证书配置后,OCSP Stapling功能会同步失效。 配置说明 1.登录边缘安全加速平台控制台。 2.在域名基础配置页面,点击目标域名。 3.进入HTTPS配置页面,单击“编辑配置” 4.变更“OCSP Stapling”从关闭改为开启。
        来自:
        帮助文档
        边缘安全加速平台
        安全与加速
        域名操作指导
        基础配置
        HTTPS相关配置
        配置OCSP Stapling
      • 应用画面实时推流至直播间
        方案优势 无需配置高带宽、高显卡配置实例,云端提供高性能显卡、万兆带宽,可将应用画面无损画质 推送至直播间,带给观众4K分辨率、60帧超强观看体验! 实时配置推流地址,可按照业务需求动态开启直播推流、动态更改推流目的地! 支持多种交互输入,游戏可通过DataChannel发送弹幕指令、打造炫酷交互效果 ,可通过web页面键鼠超低延迟操控应,也可通过智能语音、手势交互、电竞手柄等新型交互方式远程操控应用! 支持无人直播模式,应用启动后,无人操控仍能持续推流,从而实现无客户端连接的情况下仍保持云端应用的运行和不间断的直播推流! 操作流程 使用流程 以下是从启动应用到开始推流的指导说明: 首先,您需要制作一个可在windows系统中运行的应用程序,若您需要游戏带交互功能,需要在应用层自行开发相关交互接口。制作完成后将应用打包为一个zip/7z/rar格式压缩包。 1. 开通实时云渲染服务]( 2. 参考 快速入门入门指导 的操作指引,将应用上传至云渲染平台,完成云端部署。 3. 应用部署完成后,通过JSSDK接入前端页面,启动应用。 4. 在JSSDK中设置启动推流: 1)若您需要主控端推流(如主播操控游戏),可将baseOption中的webrtcEnable 为 true ,并 onPlay 中执行liveStart(Url),应用启动成功后会根据您配置的Url自动开始直播推流。 const launch: Launcher await RCRLaunch({ appId, baseOptions: { startType: 1, webrtcEnable: true, // 默认为 true }, extendOptions: { onPlay: () > { // 开始推流 launch.liveStart(liveStartUrl) }, 2)如您不需要在本地电脑的前端窗口查看画面,可以使用无客户端的启动模式,将baseOption中的webrtcEnable设置为false,当 webrtcEnable 为 false 时,需要在 dataChannelConnected 事件中执行推流操作。允许无客户端连接的情况下仍保持云端 App 运行,并能通过DataChannel发送直播间弹幕至应用内。 if (!launch.option.baseOptions.webrtcEnable) { connection.event.dataChannelConnected.on(() > { // 开始推流 launch.liveStart(liveStartUrl) }); } 说明 如您需要修改推流协议、编码格式,请联系我们客服进行后台配置。 当前推流默认格式为:音频编码AAC、视频编码H264、封装格式RTMP。
        来自:
        帮助文档
        实时云渲染(文档停止维护)
        最佳实践
        应用画面实时推流至直播间
      • 远程证明服务
        本文介绍天翼云远程证明服务,包括工作原理、使用方式和计费说明。 概述 天翼云远程证明服务是一个统一的解决方案,可用于验证不同平台(如鲲鹏、海光、intel 、AMD等)的可信度和在该平台中运行的代码的完整性。该服务支持对基于虚拟可信平台模块vTPM(virtual Trusted Platform Module)的平台进行证明,以及对可信执行环境TEE(Trusted Execution Environment)的状态进行证明。 工作原理 基于硬件信任根建立从硬件到软件的可信启动链,并利用该信任根对系统状态生成密码学签名的报告。远端验证者通过验证该报告的完整性和真实性,并与预定义的可信策略进行比对,来达成两个核心目标: 确认平台基于真实的硬件可信根。 确认平台运行了符合预期的软件栈。 使用方式 远程证明服务主要用于对机密云主机和可信云主机进行远程证明,目前仅提供通过OpenAPI进行认证(详细可参见远程证明服务OpenAPI),主要有以下两种使用方式: 方式一: 1. 在可信/机密云主机启动过程中,(虚拟)硬件会度量所涉及的软件并保存度量值; 2. 启动完成后,您可从云主机内调用相关接口获得“证据“,由(虚拟)硬件内密钥所签名的内容(包含度量值); 3. 您可以将“证据”提交给远程证明服务进行校验。远程证明服务负责取得(虚拟)硬件内密钥所对应的证书,用于校验“证据”确实由对应(虚拟)硬件生成,便验证了平台是基于真实的硬件可信根; 4. 您可以进一步检查“证据”中各字段的值(包含度量值),便验证了平台运行了符合预期的软件栈。 方式二: 1. 您需要制定证据校验策略,并将策略上传至远程证明服务; 2. 在可信/机密云主机启动过程中,(虚拟)硬件会度量所涉及的软件并保存度量值; 3. 启动完成后,您可从云主机内调用相关接口获得“证据“——由(虚拟)硬件内密钥所签名的内容(包含度量值); 4. 您可以将“证据”提交给远程证明服务进行校验,提交时指定使用哪个策略进行校验。远程证明服务负责取得(虚拟)硬件内密钥所对应的证书,用于校验“证据”确实由对应(虚拟)硬件生成,便验证了平台是基于真实的硬件可信根;策略中包含客户预期的“证据”中各个字段的值(包含度量值),将预期值(基准值)与生成值作对比,便验证了平台是基于真实的硬件可信根。
        来自:
        帮助文档
        弹性云主机 ECS
        安全合规
        机密计算与可信计算
        远程证明服务
      • 远程证明服务(1)
        本文介绍天翼云远程证明服务,包括工作原理、使用方式和计费说明。 概述 天翼云远程证明服务是一个统一的解决方案,可用于验证不同平台(如鲲鹏、海光、intel 、AMD等)的可信度和在该平台中运行的代码的完整性。该服务支持对基于虚拟可信平台模块vTPM(virtual Trusted Platform Module)的平台进行证明,以及对可信执行环境TEE(Trusted Execution Environment)的状态进行证明。 工作原理 基于硬件信任根建立从硬件到软件的可信启动链,并利用该信任根对系统状态生成密码学签名的报告。远端验证者通过验证该报告的完整性和真实性,并与预定义的可信策略进行比对,来达成两个核心目标: 确认平台基于真实的硬件可信根。 确认平台运行了符合预期的软件栈。 使用方式 远程证明服务主要用于对机密云主机和可信云主机进行远程证明,目前仅提供通过OpenAPI进行认证(详细可参见远程证明服务OpenAPI),主要有以下两种使用方式: 方式一: 1. 在可信/机密云主机启动过程中,(虚拟)硬件会度量所涉及的软件并保存度量值; 2. 启动完成后,您可从云主机内调用相关接口获得“证据“,由(虚拟)硬件内密钥所签名的内容(包含度量值); 3. 您可以将“证据”提交给远程证明服务进行校验。远程证明服务负责取得(虚拟)硬件内密钥所对应的证书,用于校验“证据”确实由对应(虚拟)硬件生成,便验证了平台是基于真实的硬件可信根; 4. 您可以进一步检查“证据”中各字段的值(包含度量值),便验证了平台运行了符合预期的软件栈。 方式二: 1. 您需要制定证据校验策略,并将策略上传至远程证明服务; 2. 在可信/机密云主机启动过程中,(虚拟)硬件会度量所涉及的软件并保存度量值; 3. 启动完成后,您可从云主机内调用相关接口获得“证据“——由(虚拟)硬件内密钥所签名的内容(包含度量值); 4. 您可以将“证据”提交给远程证明服务进行校验,提交时指定使用哪个策略进行校验。远程证明服务负责取得(虚拟)硬件内密钥所对应的证书,用于校验“证据”确实由对应(虚拟)硬件生成,便验证了平台是基于真实的硬件可信根;策略中包含客户预期的“证据”中各个字段的值(包含度量值),将预期值(基准值)与生成值作对比,便验证了平台是基于真实的硬件可信根。
        来自:
      • 应用场景
        本文为您介绍密钥管理服务的应用场景。 密钥管理服务KMS(Key Management Service)具有广泛的应用场景。 场景介绍 应用场景 开发者身份 受保护数据 保护目的 解决方案 敏感信息加密保护 网站或应用开发 证书、密钥 网站和应用使用HTTPS证书来保证通信协议的安全性,同时使用密钥对文件进行数据签名。这些安全解决方案非常依赖证书和密钥本身的安全性。 敏感数据在线加密 敏感信息加密保护 后台服务开发 密码、登录密钥、配置信息 数据库密码、登录密钥以及后台服务的配置信息可能会被黑客利用,明文存储在硬盘上非常危险。 敏感数据在线加密 重要文件加密保护 内容、社交网站或应用 用户原创内容、有价值的知识产权 企业依赖核心的UGC内容或独特的知识产权来建立行业竞争优势,务必防范“拖库”事故的发生。 信封加密 重要文件加密保护 政府、金融机构 协议通信内容、重要文件和资料 政府和金融机构的通信和存储数据具有高价值性和高保密性,需要在建立业务系统时就充分考虑安全性和合规性。 [敏感数据在线加密](
        来自:
        帮助文档
        密钥管理
        产品介绍
        应用场景
      • 天翼云函数计算一键部署DeepSeek大模型
        大模型部署难点 大模型的部署面临诸多挑战,这些难点主要集中在硬件资源、数据处理、模型优化、安全性以及实际应用的适配等多个方面。个人用户想部署大模型主要有下列难点: 硬件资源成本大:大模型的训练和推理需要强大的硬件支持,通常需要高性能的 GPU/TPU 集群;例如推理时可能需要 A100、H100 等高端 GPU。即使是较小的模型(如1.5B参数),也需要至少4GB显存的GPU和16GB内存。 软件环境与配置难:部署需要搭建复杂的软件环境,涉及操作系统、AI 框架等,配置错误可能导致模型无法运行。部署过程中可能遇到依赖环境不兼容或缺失的问题,例如 Python、CUDA 版本不匹配。 缺乏中文支持:许多部署工具(如Ollama、Docker)不提供中文支持,进一步增加了模型部署门槛。 技术支持不足:本地部署需要掌握一定的专业支持,特别是故障排除和模型优化;依靠个人自查解决问题难度很大,且效率低下。 FAAS平台部署DeepSeek 接下来将分别从平台优势、部署架构、操作步骤等几个方面,为您详细展示如何通过天翼云 FAAS 平台快速部署 DeepSeek 大模型,构建私有的 AI 智能问答应用。 平台优势 免运维:FAAS 提供全托管 Serverless 计算服务,无需管理维护基础设施;用户只需要指定GPU资源规格,平台就会置备好计算资源即刻使用;同时 24h 服务的技术支持团队,随时为用户提供专业支持和答疑解惑。 低成本:FAAS 平台采用极低的按量计费模式,根据用户实际使用的资源量进行收费;用户不再需要承担高额的 GPU 硬件购买、租用、这就成本,甚至能够以最低的费用使用到最新的 GPU 卡。 开箱即用:FAAS 平台开箱即用,省去了复杂的软件环境、操作系统、框架配置等操作;提供多种 AI应用模板、GPU函数模板,帮助用户快速构建部署AI应用和大模型。 高弹性:FAAS 平台支持实时弹性伸缩和动态负载均衡,秒级扩缩容能力灵活调度计算资源;保障应用服务稳定高可用,相比于人工扩缩容提效显著。
        来自:
        帮助文档
        函数计算
        DeepSeek专题
        实践指南:DeepSeek驱动高效能云生态
        函数计算:天翼云函数计算与DeepSeek大模型
        天翼云函数计算一键部署DeepSeek大模型
      • 流程设计
        参数名 说明 上级流程 第一层的流程,其上级流程为空,不用填。 非第一层的流程,其上级流程不能为空。上级流程为多级流程时,流程之间以“/”分隔。例如“集成产品开发/开发生命周期”。 名称 流程名称。 责任人 流程的责任人,可以手动输入名字或直接选择已有的责任人。 描述 流程的描述信息。
        来自:
        帮助文档
        数据治理中心 DataArts Studio
        用户指南
        数据架构
        数据调研
        流程设计
      • 设置
        本节介绍应用市场的相关设置功能。 在设置页面,管理员可以调整客户端展示设置、审批设置和其他设置。 客户端设置 客户端设置,主要是平台应用的相关设置。可以选择打开或关闭展示平台应用,如果选择关闭,页面不会展示平台菜单和行业选择等内容。 关闭后,应用市场客户端内会屏蔽“分类”和“行业”菜单,首页菜单也不再展示平台应用数据。 管理员如果开启展示平台应用,客户端首页将展示平台提供的各类应用。 并且可以通过“仅展示特定行业”的开关,选择是否只展示特定行业应用。关闭默认展示全部行业应用,开启后可选择3个以内不同行业的应用,应用市场客户端上也会展示行业标签。 审批设置 审批设置,可以选择开启或关闭应用上架、应用推荐、应用方向的审批开关。 注:开启应用上架审批后,请确认“审批流程流程配置”中的“应用市场应用上架”流程已开启并设置审批人。如需部门主管逐级审批,请在“审批流程分管设置”中配置。详情请参见上架审批。
        来自:
        帮助文档
        天翼云电脑(政企版)
        扩展功能
        应用市场
        管理员指南
        控制台其他功能
        设置
      • 使用限制
        本文介绍了智能边缘云的配额限制、怎样查看配额、如何申请扩大配额,以及订购时提示无权限的处理方案。 什么是配额 边缘云集群单个集群的资源相对于较小,为保证资源的有效利用率,我们对每个客户及每个集群都设置了配额限制。如需提高限额,请联系您的客户经理调整配额。 配额类型 单集群配额:单集群配额表明了用户在单个 ECX 集群自助操作管理、或实例运行过程中自动占用资源的额度。 通用平台配额: 平台配额表明了用户在 ECX 平台自助操作管理时可占用资源的额度。 通用平台配额仅代表您可以在智能边缘云占用的资源总量,具体每个集群的配额不一样,客户在具体集群中可开资源以单集群配额、通用平台配额的较小值为准。 如何查看配额 开通对应类型的资源实例前,在实例列表页集群信息位置查看对应资源类型的配额信息。 通用平台配额 边缘虚拟机 资源名称 配额限制 单位 vCPU 1000 核(vCPU) 内存 1200 GB GPU 5 块 虚机私有镜像 15 个 边缘存储配额 资源名称 配额限制 单位 通用文件 20 个 单个通用文件存储容量上限 32 TB 本地盘 20000 GB 云硬盘 800 GB 本地裸盘 700000 GB 每个云盘最大手动快照数 10 个 每台虚拟机手动整机备份上限 5 个 每个云盘最大手动备份数 5 个
        来自:
        帮助文档
        智能边缘云
        产品简介
        使用限制
      • 通过GPUStack部署模型推理平台
        步骤2:部署模型 1. 登录GPUStack平台。初次进入GPUStack平台,GPUstack默认账号为admin,密码为gpustack,正确输入用户名及密码后,点击“登录”,进入平台。 说明 GPUStack平台的用户名及密码,可在登录后进行修改。 2. 进入模型库页,选择适合的模型,点击需要部署的模型卡片,本文以“Qwen332B”模型为例。 3. 配置模型参数。 1)基本信息:点击基本信息tab,确认模型、推理后端、后端版本相互匹配,例如:“Qwen32B”模型,推理后端为“vLLM”,后端版本建议选择“0.15.1”. 2)调度:点击“调度页签”GPU卡调度配置。调度方式推荐选择“手动”,GPU器选择推荐选择全部GPU卡,也可以根据您的实际调度情况进行分配。 3)高级:点击“高级”页签,点击“添加参数”按钮,增加以下2个后端参数 : plaintext toolcallparser hermes enableautotoolchoice 4)参数配置完成后,点击“提交”按钮,开始部署模型。 您可以在“部署”模块中查看部署进度,由于模型文件较大,从获取到部署大约需要20分钟左右的时间。 4. 模型部署完成后,您可以在GPUStack平台中,使用“试验场”模块中的“对话”能力,进行简单的对话以验证模型是否部署成功。
        来自:
        帮助文档
        轻量型云主机
        最佳实践
        通过GPUStack部署模型推理平台
      • 边缘接入服务版本介绍
        本文介绍边缘安全加速平台边缘接入服务不同套餐版本适用的业务规模、支持的功能情况。 套餐和版本概述 天翼云边缘安全加速平台边缘接入服务支持包年包月计费模式。本文介绍不同套餐版本适用的业务规模、支持的功能情况。 边缘安全加速平台边缘接入服务的套餐版本分为:基础版、定制版。 适用的业务规模 下表描述了不同版本适用的业务规模。一般情况下,对于中小型规模的企业网站,推荐您选择基础版。 注意 定制版不支持线上订购,若需要订购,请提交工单给天翼云客服。 加速区域 中国内地 全球(不含中国内地) 全球 价格(元/月) 2000 3000 3400 适用场景 适合访问请求和源站都在中国内地的TCP/UDP等四层加速场景。 适合如下三种加速场景: 1. 源站在海外访问请求在国内的TCP/UDP等四层加速场景。 2. 源站在国内访问请求在海外的TCP/UDP等四层加速场景。 3. 源站和访问请求都在海外的TCP/UDP等四层加速场景。 全球范围内加速您的四层TCP/UDP应用,不限制访问区域与源站所在地。 上下行带宽/流量 中国内地:10Mbps/1TB 全球(不含中国内地):5Mbps/500GB 中国内地:2.5Mbps/250GB 全球(不含中国内地):2.5Mbps/250GB 四层DDoS防护 防护流量:40Gbps 防护次数:1次 平台级尽力防护 中国内地:防护流量:40Gbps;防护次数:1次 全球(不含中国内地):平台级尽力防护 IP应用加速域名个数 1 1 1 端口数 5 5 5
        来自:
        帮助文档
        边缘安全加速平台
        产品介绍
        产品简介
        边缘接入服务版本介绍
      • Snapckpt加速
        SnapCheckpoint(Snapckpt)是由息壤训推智算服务平台提供的针对大模型训练场景提供的高性能checkpoint框架。Snapckpt提供了高效便捷的断点存储、加载机制。 Snapckpt加速包 SnapCheckpoint(Snapckpt)是由息壤一体化智算服务平台 训推智算服务平台提供的针对大模型训练场景提供的高性能checkpoint框架。Snapckpt提供了高效便捷的断点存储、加载机制。 Snapckpt介绍 Snapckpt是一种为大模型训练打造的易用、可拓展、高性能的断点解决方案。Snapckpt提供了高效便捷的断点存储、加载机制,其主要有以下几大优势: 1. 异步断点保存:通过优化断点保存流程,使得断点保存过程异步化,尽可能减小断点保存过程对于训练的中断,减少训练阶段耗时。 2. 分布式断点存储:对模型机优化器参数进行分布式存储,避免集中式存储带来的额外通信开销,大幅降低存储与加载断点的耗时。 3. 多框架支持:支持MegatronLM、Deepspeed两大主流大模型训练框架。 4. 简单易用:安装及使用方式简单,用户仅需简单步骤即可使用,提升使用效率。 背景信息 在大规模分布式模型训练过程中,系统可能因硬件故障或软件异常导致训练中断。为确保训练进度可恢复,业界普遍采用周期性保存检查点(Checkpoint)的方案。值得注意的是,检查点操作耗时与模型参数量呈正相关关系,当面对参数量达百亿甚至千亿级别的大模型时,每次检查点保存往往需要耗费数分钟至十余分钟不等。特别是在使用MegatronLM框架或原生PyTorch进行训练时,检查点保存过程会强制暂停训练任务,导致宝贵的计算资源被闲置。因此,开发高效的检查点机制以降低时间成本和资源浪费,已成为当前大规模模型训练亟待解决的关键问题。 Snapckpt采用多阶段异步断点存储机制,降低断点存储耗时,减少训练中断带来的影响,从而提升训练速度,提升计算资源有效利用率。
        来自:
        帮助文档
        训推服务
        用户指南
        训推加速
        Snapckpt加速
      • 计费类
        本节介绍了微服务应用平台MSAP的计费类常见问题 微服务云应用平台是否收费? 微服务云应用平台自身系统是免费的,但不包含用户自行开通的laaS层资源、中间件资源的费用,具体费用请参考各产品计费文档。 关联产品 计费说明链接 微服务引擎微服务治理中心 计费说明 云容器引擎 计费说明 应用性能监控APM 计费说明 云日志服务ALS 计费说明 容器镜像服务 计费说明 微服务引擎注册配置中心 计费说明
        来自:
        帮助文档
        微服务云应用平台
        常见问题
        计费类
      • 1
      • ...
      • 15
      • 16
      • 17
      • 18
      • 19
      • ...
      • 155
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      天翼云新春焕新季

      云主机开年特惠28.8元/年,0元秒杀等你来抢!

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      物理机 DPS

      镜像服务 IMS

      弹性高性能计算 E-HPC

      公共算力服务

      应用托管

      一站式智算服务平台

      智算一体机

      人脸活体检测

      人脸比对

      推荐文档

      登录

      常见问题

      什么是分布式消息服务

      玩转天翼云③:centos6和7通过snat实现上网

      查询日志

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号