活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云信创专区 NEW “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      VPC终端节点_相关内容
      • 全量数据恢复:恢复到指定时间点
        本节包含全量数据恢复:恢复到指定时间点的相关内容。 操作场景 关系型数据库服务支持使用已有的自动备份,恢复实例数据到指定时间点。 实例恢复到指定时间点,会从OBS备份空间中选择一个该时间点最近的全量备份下载到实例上进行全量恢复,再重放增量备份到指定时间点,恢复时长和实例的数据量有关,平均恢复速率为30MB/s。 功能说明 表 功能说明 类别 说明 恢复范围 恢复整个实例。 恢复后实例数据 恢复后实例数据与用于恢复的“全备文件+增备文件”中的数据一致。 恢复到新实例会为用户重新创建一个和该时间点数据相同的实例。 恢复到已有实例会导致实例数据被覆盖。 恢复的时间点 可以恢复到全量备份保留时间内,最早的一个全量备份之后的任意时间点内的数据。 恢复类型 恢复到新实例 恢复到已有实例(非原实例) 恢复到新实例各配置项 新实例的数据库引擎和数据库版本,自动与原实例相同。 其他参数需要重新配置。 恢复时长 恢复时长和实例的数据量有关,平均恢复速率为30MB/s。 限制条件 恢复到已有实例(非原实例)的限制: − 恢复到已有实例会导致实例数据被覆盖,且恢复过程中实例将不可用。 − 只可选择与原实例相同VPC,相同引擎,相同版本的实例。例如:16.5版本的实例备份只能恢复到16.5版本的目标实例,无法恢复到16.6版本的目标实例。 − 请确保目标实例的存储空间大于或等于当前实例的存储空间,否则会导致任务下发失败。
        来自:
        帮助文档
        关系数据库PostgreSQL版
        用户指南
        数据恢复
        恢复到云上PostgreSQL数据库
        全量数据恢复:恢复到指定时间点
      • 产品优势
        本章介绍关系数据库的优势,关系型数据库具有低成本、高安全性、高可靠性等优势,相对传统数据库运维繁琐等缺陷,关系型数据库使用更加方便简单。 低成本 即开即用 您可以通过官网实时生成目标实例,关系型数据库服务配合弹性云主机一起使用,通过内网连接关系型数据库可以有效的降低应用响应时间、节省公网流量费用。 弹性扩容 可以根据您的业务情况弹性伸缩所需的资源,按需开支,量身订做。配合云监控(Cloud Eye)监测数据库压力和数据存储量的变化,您可以灵活调整实例规格。 完全兼容 您无需再次学习,关系型数据库各引擎的操作方法与原生数据库引擎的完全相同。关系型数据库还兼容现有的程序和工具。 运维便捷 RDS的日常维护和管理,包括但不限于软硬件故障处理、数据库补丁更新等工作,保障关系型数据库运转正常。提供专业数据库管理平台,重启、重置密码、参数修改、查看错误日志和慢查询日志、恢复数据等一键式功能。提供CPU利用率、IOPS、连接数、磁盘空间等实例信息实时监控及报警,让您随时随地了解实例动态。 高安全性 网络隔离 通过虚拟私有云(Virtual Private Cloud,简称VPC)和网络安全组实现网络隔离。虚拟私有云允许租户通过配置虚拟私有云入站IP范围,来控制连接数据库的IP地址段。关系型数据库实例运行在租户独立的虚拟私有云内,可提升关系型数据库实例的安全性。您可以综合运用子网和安全组的配置,来完成关系型数据库实例的隔离。
        来自:
        帮助文档
        关系数据库MySQL版
        产品简介
        产品优势
      • 翼MapReduce MRS支持的事件列表
        翼MapReduce(翼MR)是一种基于云计算平台的数据处理分析服务,打造了高可靠、高安全、易使用的运行维护平台,对外提供大容量数据的存储和分析能力,可解决用户实时性要求不高的海量数据存储和处理需求,可以独立申请和使用托管Hadoop、Spark、HBase和Hive组件。 支持的事件列表如下: 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 DBServer主备倒换 dbServerSwitchover 次要 DBServer主备倒换 主备倒换需要和运维人员确认是否为正常操作导致。 连续触发主备倒换可能影响Hive服务正常使用,导致Hive服务不可用。 Flume Channel溢出 flumeChannelOverflow 次要 Flume Channel溢出 确认flume的channel配置是否合理,业务量是否有突增。 Flume任务无法正常写入数据到后端。 NameNode主备倒换 namenodeSwitchover 次要 NameNode主备倒换 主备倒换需要和运维人员确认是否为正常操作导致。 连续触发主备倒换可能影响HDFS服务正常使用,读写HDFS文件可能失败。 ResourceManager主备倒换 resourceManagerSwitchover 次要 ResourceManager主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响Yarn服务正常使用,导致任务出现异常甚至失败 JobHistoryServer主备倒换 jobHistoryServerSwitchover 次要 JobHistoryServer主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响MapReduce服务正常使用,导致任务日志读取异常 HMaster主备倒换 hmasterFailover 次要 HMaster主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响HBase服务正常使用 Hue发生主备切换 hueFailover 次要 Hue发生主备切换 主备倒换需要和运维人员确认是否为正常操作导致 主备倒换可能影响HUE服务正常使用,导致页面无法使用等问题 Impala HaProxy服务发生主备切换 impalaHaProxyFailover 次要 Impala HaProxy服务发生主备切换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响Impala服务正常使用 Impala StateStoreCatalog服务发生主备切换 impalaStateStoreCatalogFailover 次要 Impala StateStoreCatalog服务发生主备切换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响Impala服务正常使用 LdapServer主备倒换 ldapServerFailover 次要 LdapServer主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 连续触发主备倒换可能影响LdapServer服务正常使用 Loader主备倒换 loaderSwitchover 次要 Loader主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 主备倒换可能影响Loader服务正常使用 Manager主备倒换 managerSwitchover 提示 Manager主备倒换 主备倒换需要和运维人员确认是否为正常操作导致 Manager主备倒换可能导致Manager页面无法正常访问,部分监控可能出现异常数值 作业执行失败 jobRunningFailed 提示 作业执行失败 查看作业管理页面,确认失败任务是否有异常 作业执行过程出现失败 作业被终止 jobkilled 提示 作业被终止 确认任务是否人为下发终止命令 作业执行过程被终止 Oozie工作流执行失败 oozieWorkflowExecutionFailure 次要 Oozie工作流执行失败 查看Oozie日志,确认任务失败原因 Oozie工作流执行失败 Oozie定时任务执行失败 oozieScheduledJobExecutionFailure 次要 Oozie定时任务执行失败 查看Oozie日志,确认任务失败原因 Oozie定时任务执行失败 ClickHouse服务不可用 clickHouseServiceUnavailable 紧急 ClickHouse服务不可用 请参考《MapReduce服务用户指南》的“ALM45425 ClickHouse服务不可用”章节。 ClickHouse服务异常,无法通过FusionInsight Manager对ClickHouse进行集群操作,无法使用ClickHouse服务功能。 DBService服务不可用 dbServiceServiceUnavailable 紧急 DBService服务不可用 请参考《MapReduce服务用户指南》的“ALM27001 DBService服务不可用”章节。 数据库服务不可用,无法对上层服务提供数据入库、查询等功能,使部分服务异常。 DBService主备节点间心跳中断 dbServiceHeartbeatInterruption BetweentheActiveAndStandbyNodes 重要 DBService主备节点间心跳中断 请参考《MapReduce服务用户指南》的“ALM27003 DBService主备节点间心跳中断”章节。 DBService主备间心跳中断时只有一个节点提供服务,一旦该节点故障,再无法切换到备节点,就会服务不可用。 DBService主备数据不同步 dataInconsistencyBetween ActiveAndStandbyDBServices 紧急 DBService主备数据不同步 请参考《MapReduce服务用户指南》的“ALM27004 DBService主备数据不同步”章节。 主备DBServer数据不同步,如果此时主实例异常,则会出现数据丢失或者数据异常的情况。 数据库进入只读模式 databaseEnterstheReadOnlyMode 紧急 数据库进入只读模式 请参考《MapReduce服务用户指南》的“ALM27007 数据库进入只读模式”章节。 数据库进入只读模式,业务数据丢失。 Flume服务不可用 flumeServiceUnavailable 紧急 Flume服务不可用 请参考《MapReduce服务用户指南》的“ALM24000 Flume服务不可用”章节。 当Flume服务不可用时,Flume不能正常工作,数据传输业务中断。 Flume Agent异常 flumeAgentException 重要 Flume Agent异常 请参考《MapReduce服务用户指南》的“ALM24001 Flume Agent异常”章节。 产生告警的Flume Agent实例无法正常启动,定义在该实例下的数据传输任务暂时中断,对于实时数据传输,会丢失实时数据。 Flume Client连接中断 flumeClientDisconnected 重要 Flume Client连接中断 请参考《MapReduce服务用户指南》的“ALM24003 Flume Client连接中断”章节。 产生告警的Flume Client无法与Flume Server端进行通信,Flume Client端的数据无法传输到Flume Server端。 Flume读取数据异常 exceptionOccursWhenFlumeReadsData 重要 Flume读取数据异常 请参考《MapReduce服务用户指南》的“ALM24004 Flume读取数据异常”章节。 如果数据源有数据,Flume Source持续读取不到数据,数据采集会停止。 Flume传输数据异常 exceptionOccursWhenFlumeTransmitsData 重要 Flume传输数据异常 请参考《MapReduce服务用户指南》的“ALM24005 Flume传输数据异常”章节。 Flume Channel的磁盘空间使用量有继续增长的趋势,将会使数据导入到指定目的地的时间增长,当Flume Channel的磁盘空间使用量达到100%时会导致Flume Agent进程暂停工作。 Flume 证书文件非法或已损坏 flumeCertificateFileIsinvalid 重要 Flume 证书文件非法或已损坏 请参考《MapReduce服务用户指南》的“ALM24010 Flume证书文件非法或已损坏”章节。 Flume证书文件已经非法或损坏,功能受限,Flume客户端将无法访问Flume服务端。 Flume 证书文件即将过期 flumeCertificateFileIsAboutToExpire 重要 Flume 证书文件即将过期 请参考《MapReduce服务用户指南》的“ALM24011 Flume证书文件即将过期”章节。 Flume证书文件即将失效,对系统目前运行无影响。 Flume 证书文件已过期 flumeCertificateFileIsExpired 重要 Flume 证书文件已过期 请参考《MapReduce服务用户指南》的“ALM24012 Flume证书文件已过期”章节。 Flume证书文件已过期,功能受限,Flume客户端将无法访问Flume服务端。 Flume MonitorServer证书文件失效 flumeMonitorServerCertificateFileIsInvalid 重要 Flume MonitorServer证书文件失效 请参考《MapReduce服务用户指南》的“ALM24013 Flume MonitorServer证书文件非法或已损坏”章节。 MonitorServer证书文件已经非法或损坏,功能受限,Flume客户端将无法访问Flume服务端。 Flume MonitorServer证书文件即将过期 flumeMonitorServerCertificate FileIsAboutToExpire 重要 Flume MonitorServer证书文件即将过期 请参考《MapReduce服务用户指南》的“ALM24014 Flume MonitorServer证书文件即将过期”章节。 MonitorServer证书文件即将失效,对系统目前运行无影响。 Flume MonitorServer证书文件已过期 flumeMonitorServerCertificateFileIsExpired 重要 Flume MonitorServer证书文件已过期 请参考《MapReduce服务用户指南》的“ALM24015 Flume MonitorServer证书文件已过期”章节。 MonitorServer证书文件已过期,功能受限,Flume客户端将无法访问Flume服务端。 HDFS服务不可用 hdfsServiceUnavailable 紧急 HDFS服务不可用 请参考《MapReduce服务用户指南》的“ALM14000 HDFS服务不可用”章节。 无法为基于HDFS服务的HBase和MapReduce等上层部件提供服务。用户无法读写文件。 NameService服务异常 nameServiceServiceUnavailable 重要 NameService服务异常 请参考《MapReduce服务用户指南》的“ALM14010 NameService服务异常”章节。 无法为基于该NameService服务的HBase和MapReduce等上层部件提供服务。用户无法读写文件。 DataNode数据目录配置不合理 datanodeDataDirectoryIsNotConfiguredProperly 重要 DataNode数据目录配置不合理 请参考《MapReduce服务用户指南》的“ALM14011 DataNode数据目录配置不合理”章节。 如果将DataNode数据目录挂载在根目录等系统关键目录,长时间运行后会将根目录写满,导致系统故障。不合理的DataNode数据目录配置,会造成HDFS的性能下降。 Journalnode数据不同步 journalnodeIsOutOfSynchronization 重要 Journalnode数据不同步 请参考《MapReduce服务用户指南》的“ALM14012 Journalnode数据不同步”章节。 当一个JournalNode节点工作状态异常时,其数据就会与其他JournalNode节点的数据不同步。如 果超过一半的JournalNode节点的数据不同步时,NameNode将无法工作,导致HDFS服务不可用。 NameNode FsImage文件更新失败 failedToUpdateTheNameNodeFsImageFile 重要 NameNode FsImage文件更新失败 请参考《MapReduce服务用户指南》的“ALM14013 NameNode FsImage文件更新失败”章节。 如果主NameNode数据目录的FsImage没有更新,则说明HDFS元数据合并功能异常,需要修复。 如不修复,HDFS在运行一段时间后,Editlog会一直增长。此时如果重启HDFS,由于要加载非常多的Editlog,会导致启动非常耗时。另外,该告警的产生也说明备NameNode功能异常,导致NameNode的HA机制失效。一旦主NameNode故障,则整个HDFS服务将不可用。 DataNode磁盘故障 datanodeDiskFault 重要 DataNode磁盘故障 请参考《MapReduce服务用户指南》的“ALM14027 DataNode磁盘故障”章节。 上报DataNode磁盘故障告警时,表示该DataNode节点上存在故障的磁盘分区,可能会导致已写入的文件丢失。 Yarn服务不可用 yarnServiceUnavailable 紧急 Yarn服务不可用 请参考《MapReduce服务用户指南》的“ALM18000 Yarn服务不可用”章节。 集群无法提供Yarn服务。用户无法执行新的application。已提交的application无法执行。 NodeManager心跳丢失 nodemanagerHeartbeatLost 重要 NodeManager心跳丢失 请参考《MapReduce服务用户指南》的“ALM18002 NodeManager心跳丢失”章节。 丢失的NodeManager节点无法提供Yarn服务。容器减少,集群性能下降。 NodeManager不健康 nodemanagerUnhealthy 重要 NodeManager不健康 请参考《MapReduce服务用户指南》的“ALM18003 NodeManager不健康”章节。 故障的NodeManager节点无法提供Yarn服务。容器减少,集群性能下降。 Yarn 任务执行超时 yarnApplicationTimeout 次要 Yarn 任务执行超时 请参考《MapReduce服务用户指南》的“ALM18020 Yarn任务执行超时”章节。 任务执行超时后的运行时间内,该告警一直存在,但任务仍继续正常执行,没有任何影响。 Mapreduce服务不可用 mapreduceServiceUnavailable 紧急 Mapreduce服务不可用 请参考《MapReduce服务用户指南》的“ALM18021 Mapreduce服务不可用”章节。 集群无法提供Mapreduce服务,如无法通过Mapreduce查看任务日志,无法提供Mapreduce服务的日志归档功能等。 Yarn队列资源不足 insufficientYarnQueueResources 次要 Yarn队列资源不足 请参考《MapReduce服务用户指南》的“ALM18022 Yarn队列资源不足”章节。 应用任务结束时间变长。新应用提交后长时间无法运行。 HBase服务不可用 hbaseServiceUnavailable 紧急 HBase服务不可用 请参考《MapReduce服务用户指南》的“ALM19000 HBase服务不可用”章节。 无法进行数据读写和创建表等操作。 HBase系统表目录或文件丢失 systemTablePathOrFileOfHBaseIsMissing 紧急 HBase系统表目录或文件丢失 请参考《MapReduce服务用户指南》的“ALM19012 HBase系统表目录或文件丢失”章节。 HBase服务重启/启动失败。 Hive服务不可用 hiveServiceUnavailable 紧急 Hive服务不可用 请参考《MapReduce服务用户指南》的“ALM16004 Hive服务不可用”章节。 Hive无法提供数据加载,查询,提取服务。 Hive数据仓库被删除 hiveDataWarehouseIsDeleted 紧急 Hive数据仓库被删除 请参考《MapReduce服务用户指南》的“ALM16045 Hive数据仓库被删除”章节。 Hive默认数据仓库被删除,会导致在默认数据仓库中创建库、创建表失败,影响业务正常使用。 Hive数据仓库权限被修改 hiveDataWarehousePermissionIsModified 紧急 Hive数据仓库权限被修改 请参考《MapReduce服务用户指南》的“ALM16046 Hive数据仓库权限被修改”章节。 Hive默认数据仓库的权限被修改,会影响当前用户,用户组,其他用户在默认数据仓库中创建库、创建表等操作的操作权限范围。会扩大或缩小权限。 HiveServer已从Zookeeper注销 hiveServerHasBeenDeregisteredFromZookeeper 重要 HiveServer已从Zookeeper注销 请参考《MapReduce服务用户指南》的“ALM16047 HiveServer已从Zookeeper注销”章节。 当无法在Zookeeper上读取到Hive的配置,将会导致HiveServer不可用。 tez或者spark库路径不存在 tezlibOrSparklibIsNotExist 重要 tez或者spark库路径不存在 请参考《MapReduce服务用户指南》的“ALM16048 Tez或者Spark库路径不存在”章节。 Tez或者Spark库路径不存在,会影响Hive on Tez,Hive on Spark的功能。 Hue服务不可用 hueServiceUnavailable 紧急 Hue服务不可用 请参考《MapReduce服务用户指南》的“ALM20002 Hue服务不可用”章节。 系统无法提供数据加载,查询,提取服务。 Impala服务不可用 impalaServiceUnavailable 紧急 Impala服务不可用 请参考《MapReduce服务用户指南》的“ALM29000 Impala服务不可用”章节。 Impala服务异常,无法通过FusionInsight Manager对Impala进行集群操作,无法使用Impala服务功能。 Kafka服务不可用 kafkaServiceUnavailable 紧急 Kafka服务不可用 请参考《MapReduce服务用户指南》的“ALM38000 Kafka服务不可用”章节。 集群无法对外提供Kafka服务,用户无法执行新的Kafka任务。 Kafka默认用户状态异常 statusOfKafkaDefaultUserIsAbnormal 紧急 Kafka默认用户状态异常 请参考《MapReduce服务用户指南》的“ALM38007 Kafka默认用户状态异常”章节。 Kafka默认用户状态异常,会影响Broker之间的元数据同步,以及Kafka与ZooKeeper之间的交互,进而影响业务生产、消费和Topic的创建、删除等操作。 Kafka数据目录状态异常 abnormalKafkaDataDirectoryStatus 重要 Kafka数据目录状态异常 请参考《MapReduce服务用户指南》的“ALM38008 Kafka数据目录状态异常”章节。 Kafka数据目录状态异常,会导致该数据目录上所有Partition的当前副本下线,多个节点同时出现数据目录状态异常,可能会导致部分Partition不可用。 存在单副本的Topic topicsWithSingleReplica 警告 存在单副本的Topic 请参考《MapReduce服务用户指南》的“ALM38010 存在单副本的Topic”章节。 单副本的Topic存在单点故障风险,当副本所在节点异常时,会直接导致Partition没有leader,影响该Topic上的业务。 KrbServer服务不可用 krbServerServiceUnavailable 紧急 KrbServer服务不可用 请参考《MapReduce服务用户指南》的“ALM25500 KrbServer服务不可用”章节。 告警发生时,不能对集群中的组件KrbServer进行任何操作。其它组件的KrbServer认证将受影响。集群中依赖KrbServer的组件运行状态将为故障。 Kudu服务不可用 kuduServiceUnavailable 紧急 Kudu服务不可用 请参考《MapReduce服务用户指南》的“ALM29100 Kudu服务不可用”章节。 用户无法使用Kudu服务。 LdapServer服务不可用 ldapServerServiceUnavailable 紧急 LdapServer服务不可用 请参考《MapReduce服务用户指南》的“ALM25000 LdapServer服务不可用”章节。 告警发生时,不能对集群中的KrbServer和LdapServer用户进行任何操作。 例如,无法在FusionInsight Manager页面添加、删除或修改任何用户、用户组或角色,也无法修改用户密码。集群中原有的用户验证不受影响。 LdapServer数据同步异常 abnormalLdapServerDataSynchronization 紧急 LdapServer数据同步异常 请参考《MapReduce服务用户指南》的“ALM25004 LdapServer数据同步异常”章节。 LdapServer数据不一致时,有可能是Manager上的LdapServer数据损坏,也有可能是集群上的LdapServer数据损坏,此时数据损坏的LdapServer进程将无法对外提供服务,影响Manager和集群的认证功能。 Nscd服务异常 nscdServiceIsAbnormal 重要 Nscd服务异常 请参考《MapReduce服务用户指南》的“ALM25005 Nscd服务异常”章节。 nscd服务异常时,可能会影响该节点从LdapServer上同步数据,此时,使用id命令可能会获取不到Ldap中的数据,影响上层业务。 Sssd服务异常 sssdServiceIsAbnormal 重要 Sssd服务异常 请参考《MapReduce服务用户指南》的“ALM25006 Sssd服务异常”章节。 sssd服务异常时,可能会影响该节点从LdapServer上同步数据,此时,使用id命令可能会获取不到ldap中的数据,影响上层业务。 Loader服务不可用 loaderServiceUnavailable 紧急 Loader服务不可用 请参考《MapReduce服务用户指南》的“ALM23001 Loader服务不可用”章节。 如果Loader服务不可用,数据加载,导入,转换的功能也不可用。 Oozie服务不可用 oozieServiceUnavailable 紧急 Oozie服务不可用 请参考《MapReduce服务用户指南》的“ALM17003 Oozie服务不可用”章节。 无法使用Oozie服务提交作业。 Ranger服务不可用 rangerServiceUnavailable 紧急 Ranger服务不可用 请参考《MapReduce服务用户指南》的“ALM45275 Ranger服务不可用”章节。 当Ranger服务不可用时,Ranger无法正常工作,Ranger原生UI无法访问。 RangerAdmin状态异常 abnormalRangerAdminStatus 重要 RangerAdmin状态异常 请参考《MapReduce服务用户指南》的“ALM45276 RangerAdmin状态异常”章节。 当存在单个RangerAdmin状态异常时,不影响Ranger原生UI访问;当两个RangerAdmin状态异常时,Ranger原生UI无法访问,无法执行创建、修改、删除策略等操作。 Spark2x服务不可用 spark2xServiceUnavailable 紧急 Spark2x服务不可用 请参考《MapReduce服务用户指南》的“ALM43001 Spark2x服务不可用”章节。 用户提交的Spark任务执行失败。 Storm服务不可用 stormServiceUnavailable 紧急 Storm服务不可用 请参考《MapReduce服务用户指南》的“ALM26051 Storm服务不可用”章节。 集群无法对外提供Storm服务,用户无法执行新的Storm任务。 ZooKeeper服务不可用 zooKeeperServiceUnavailable 紧急 ZooKeeper服务不可用 请参考《MapReduce服务用户指南》的“ALM13000 ZooKeeper服务不可用”章节。 ZooKeeper无法为上层组件提供协调服务,依赖ZooKeeper的组件可能无法正常运行。 ZooKeeper中组件顶层目录的配额设置失败 failedToSetTheQuotaOfTopDirectoriesOf ZooKeeperComponent 次要 ZooKeeper中组件顶层目录的配额设置失败 请参考《MapReduce服务用户指南》的“ALM13005 ZooKeeper中组件顶层目录的配额设置失败”章节。 组件可以向对应的ZooKeeper顶层目录中写入大量数据,导致Zookeeper服务不可用。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        翼MapReduce MRS支持的事件列表
      • 负载均衡概述
        负载均衡的组件 负载均衡实例 负载均衡实例是承载负载均衡业务的实体,通过在负载均衡实例中添加监听器和后端服务器组后才能使用负载均衡提供的服务。 按照网络类型,负载均衡实例分为公网和内网负载均衡实例。 公网负载均衡实例 : 负责处理来自公网的访问请求,其会绑定弹性公网IP地址。 内网负载均衡实例 :负责处理来自和负载均衡属于同一个VPC内的访问请求,其服务地址为VPC内的一个内网地址。 监听器 监听器负责监听负载均衡上接收的请求,并根据转发策略把请求分发到后端服务器组进行处理。监听器需要配置对应的协议和端口,这些协议、端口以及负载均衡的VIP地址为提供服务的地址、协议和端口。监听器支持四层(TCP或者UDP协议)和七层(HTTP或者HTTPS协议)协议,根据业务需求配置监听器对应的协议以及端口。 监听器类型说明: 协议类型 说明 适用场景 TCP 面向连接的、可靠的数据传输协议。 适用于对数据传输的准确性和可靠性较高的使用场景,如远程登录、web服务、文件传输等。 UDP 其为无连接的、可靠性低的传输协议。 适用于传输速度快、实时性要求高,但对数据准确性要求不高的使用场景,如视频会议、在线游戏等。 HTTP 应用层协议,其支持基于Cookie的会话保持功能以及基于URL的转发。 适用于对请求的数据内容进行识别的应用的使用场景,如web应用、APP等。 HTTPS 加密的应用层协议,可以防止未授权的数据访问。 需要加密传输的web应用。 转发策略 在负载均衡中监听器协议为HTTP和HTTPS时,支持在已有监听器转发的基础上添加转发策略,转发策略通过URL或域名匹配规则来把请求转发至相应的后端服务器组,便于灵活的分流业务和合理的分配资源。URL匹配规则支持精确匹配、正则匹配和前缀匹配。 在对应的监听器中添加了转发策略后,负载均衡按照以下规则转发前端请求: 1. 优先匹配监听器中的转发策略,若能匹配,则对应请求转发到该转发策略对应的后端服务器组。 2. 在监听器下所有转发策略都不能匹配的情况下,则按照监听器配置的转发规则把请求转发到该监听器对应的后端服务器组。 后端服务器组 在对应的负载均衡中配置监听器或者对应七层监听器的转发策略时需要配置对应的后端服务器组,后端服务器组包括一个或者多个后端服务器,用于承载从监听器转发的流量请求,可以通过在后端服务器组中添加后端服务器来扩展负载均衡的处理能力。后端服务器组可以按需开启健康检查,其通过健康检查的结果来判断后端服务器的状态是否正常,监听器只会把请求转发给结果为正常的后端服务器。同时后端服务器组中还可以根据每个后端服务器的不同处理能力来设置不同的权重,确保后端服务器得到最大的资源利用。 后端服务器组支持以下的分配策略: 分配策略 说明 加权轮询 根据后端服务器不同的处理能力,按需为不同的后端服务器设置不同的权重,监听器根据权重的高低以及轮询的方式把请求转发给后端服务器。 加权最少连接 通过当前每台后端服务器的活跃连接数来估算对应的负载情况,同时再根据服务器的负载情况不同以及处理能力的不同,给后端服务器动态的分配权重。 IP Hash 首先通过一致性Hash算法对所有后端服务器进行编号,对请求中的源IP地址通过一致性Hash算法,根据得到的结果把请求分发到对应编号的服务器。其可以确保把长连接的请求发送到同一个后端服务器,确保业务的连续性。
        来自:
        帮助文档
        智能边缘云
        用户指南
        边缘网络
        弹性负载均衡
        负载均衡概述
      • 清除资源
        本章节主要介绍清除资源 到此本Demo已全部操作完成,为了避免资源的浪费,请及时删除应用和节点。 步骤 1 选择左侧导航中的“体验任务”,单击Bookinfo任务中的“卸载”。 步骤 2 单击“确定”。卸载Bookinfo体验任务,会自动删除productpage、details、reviews、ratings服务及相关资源。 图 卸载体验任务 说明 卸载体验任务后,已完成灰度发布的服务,其灰度版本对应的负载需要手动在CCE控制台删除。
        来自:
        帮助文档
        应用服务网格
        快速入门
        Bookinfo应用的灰度发布实践
        清除资源
      • 产品优势
        稳定的结果预期 容灾多活产品协调应用分层组件,确保应用模块依赖不混乱,应用流量数据不冲突,通过可隔离的环境和可灰度的流量,随时能够演练,保障容灾恢复结果可预期,故障发生时业务能切也敢切。 分钟级容灾切换 容灾多活产品根据不同多活容灾架构特点,在应用请求路径的关键节点植入管控切面,通过标准化的流程模版,提炼各类故障场景下的一键切换能力,容灾运维简单高效,能够实现分钟级的RTO水平。
        来自:
        帮助文档
        应用高可用
        产品简介
        应用容灾多活
        产品优势
      • IP访问限频
        配置示例 参数名 配置值 类型 全部文件 内容 / 访问阈值 100 优先级 10 结果说明:相同客户端IP的用户,若1秒内请求同个域名资源超过100次,且都访问到CDN加速节点的同一台服务器,则前100个请求可正常响应资源内容,第101个请求会响应403状态码;该IP若后续仍在这台服务器请求该域名,则在10分钟内CDN会对该IP访问该域名资源响应403,10分钟后才可正常响应。
        来自:
        帮助文档
        CDN加速
        用户指南
        域名管理
        访问控制
        IP访问限频
      • 查询证书详情
        参数 类型 名称 是否必填 说明 name string 证书备注名 否 name和id必填其中一个,若都填返回name查询结果 id Integer 证书id 否 name和id必填其中一个,若都填返回name查询结果 usagemode Integer 证书用途 否 取值范围:0(加速域名的证书和私钥),1(客户端CA链证书),2(源站CA链证书),3(CDN回源节点证书和私钥),4(加速域名的证书和私钥(国密)),其中1、2、3是双向认证场景使用的证书
        来自:
        帮助文档
        视频直播
        API参考
        API
        证书管理
        查询证书详情
      • 直播流状态查询
        参数 类型 说明 code int 状态码 message string 描述信息 totalnum int 总数量 result list 返回结果列表 result[].hearttime string 最新时间 result[].domain string 域名 result[].app string 应用名称 result[].stream string 流名称 result[].online string 流状态。取值0和1;0表示查询的流已经结束推流,1表示当前在线流 result[].starttime string 推流开始时间 result[].clientip string 主播推流端IP result[].serverip string cdn推流节点IP
        来自:
        帮助文档
        视频直播
        API参考
        API
        统计分析
        直播流状态查询
      • ALM-18017 NodeManager非堆内存使用率超过阈值
        收集故障信息 6.在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 7.在“服务”下拉框中勾选待操作集群的如下节点信息,单击“确定”。 NodeAgent。 Yarn。 8.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 9.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-18017 NodeManager非堆内存使用率超过阈值
      • ALM-18018 NodeManager堆内存使用率超过阈值
        收集故障信息 6.在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 7.在“服务”中勾选待操作集群的如下节点信息。 NodeAgent。 Yarn。 8.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 9.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-18018 NodeManager堆内存使用率超过阈值
      • ALM-29104 Tserver进程内存占用率超过阈值
        收集故障信息 4. 在FusionInsight Manager首页,单击“运维 > 日志 > 下载”。 5. 在“服务”中勾选待操作集群的如下节点信息。 Kudu 6. 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 7. 请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-29104 Tserver进程内存占用率超过阈值
      • ALM-29100 Kudu服务不可用
        收集故障信息 5. 在FusionInsight Manager首页,单击“运维 > 日志 > 下载”。 6. 在“服务”中勾选待操作集群的如下节点信息。 Kudu 7. 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 8. 请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-29100 Kudu服务不可用
      • ALM-18008 ResourceManager堆内存使用率超过阈值
        收集故障信息 6.在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 7.在“服务”中勾选待操作集群的如下节点信息。 NodeAgent Yarn 8.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 9.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-18008 ResourceManager堆内存使用率超过阈值
      • 移除服务器(集群版适用)
        本节主要介绍移除服务器。 在“服务器管理”页面,选择要移除的服务,点击“操作”>“移除”,移除服务器。 注意 如果移除已损毁或者宕机的服务器,需要使用强制移除。强制移除服务器,会产生数据丢失风险,请谨慎操作。 如果移除服务器上有iSCSI目标,该iSCSI目标对应卷的高可用类型是ActiveStandby,移除服务器时,业务不会中断,此卷对应的iSCSI目标会切换到其他服务器上,客户端需要重新连接Target对应的新服务器IP。 如果移除服务器上有iSCSI目标,该iSCSI目标对应卷的高可用类型是Disabled,移除服务器时,业务会中断,此卷对应的iSCSI目标会切换到其他服务器上,客户端需要重新连接Target对应的新服务器IP。但服务器移除时,会有数据丢失风险。 如果执行日志采集后,产生的日志保存在服务器安装目录下,在服务器移除之后,该日志将被删除。如果产生的日志保存在HBlock的数据目录内,并且移除服务器时删除服务器HBlock数据目录中的数据,该日志也将被删除。 有服务器正在移除时,不能再移除其他服务器。如果必须移除,请使用强制移除,但有丢数据风险。 该节点的所有数据目录不属于任何存储池,允许移除该服务器。否则不能移除,如果必须移除,请使用强制移除,但有丢数据风险。 如果要移除服务器的某个数据目录属于基础存储池,且是基础存储池中仅剩的一个可用故障域中的节点,不允许移除。 如果服务器上有基础服务,不允许移除。 图1 移除服务器
        来自:
      • Oracle Grid集群管理软件安装
        本节为Oracle RAC搭建最佳实践的Grid集群管理软件进行说明。 静默安装 本安装示例中,使用response文件进行静默安装,省去了Linux桌面机器的配置,如需通过GUI界面的方式安装,请参考Oracle RAC的安装手册。 Oracle Grid的默认静默安装配置文件位于 /u01/app/gridhome/install/response/gridsetup.rsp ,需要 Oracle DBA修改其中的配置项,一些关键的配置项如: loracle.install.crs.config.clusterNodesracnode01:racnode01vip,racnode02:rac node02vip :设定集群节点。 oracle.install.crs.config.networkInterfaceListens2:192.168.100.0:5,ens5:192.168.0. 0:1 :设定PUBLIC 和ASM&PRIVATE网络使用的网卡。 oracle.install.asm.diskGroup.disks/dev/vdc,/dev/vdd,/dev/vde :设定仲裁盘。 静默安装的配置文件准备好之后,可先进行依次尝试安装(切换到grid用户,并切换到 /u01/app/gridhome/ 目录): [grid@racnode01 gridhome]$ ./gridSetup.sh silent responseFile install/response/gridsetup.rsp 尝试安装如果失败,需要提示的报错日志,依次排查报错项,处理完错误问题或确认遗留问题可忽略,则可以通过添加ignorePrereqFailure参数跳过依赖报错问题。 [grid@racnode01 gridhome]$ ./gridSetup.sh silent ignorePrereqFailure responseFile install/response/gridsetup.rsp 安装后执行脚本 安装完成之后,执行输出会提示需要以root账号执行脚本,分别在各个节点上执行: [root@racnode01 ~] /u01/app/oraInventory/orainstRoot.sh [root@racnode01 ~] /u01/app/gridhome/root.sh 安装后检查 注意 由于心跳线haip功能暂时无法使用,心跳通信受阻,OCR disk group会显示未正常挂载。没有心跳线负载均衡需求的用户,可以通过禁用haip功能,将集群状态恢复。 [root@racnode01 ~]
        来自:
        帮助文档
        物理机 DPS
        最佳实践
        弹性裸金属ORACLE RAC搭建最佳实践
        Oracle软件配置安装
        Oracle Grid集群管理软件安装
      • Redis版本类型差异
        说明 分布式缓存Redis增强版,专注于多线程和高吞吐量,通过优化Redis配置参数,计算每个Redis数据分片所在虚机规格来相应调整线程参数,最终达到最优性能。 对比项 基础版 增强版 经典版 兼容开源Redis版本 兼容开源Redis 5.0/6.0/7.0,单线程 兼容开源Redis 6.0/7.0,多线程 兼容开源Redis 2.8/4.0/5.0,单线程 性能 单分片QPS达10万/秒 单分片QPS达22万~30万/秒 单分片QPS达10万/秒 实例规格 提供标准版、Cluster集群、Proxy集群、读写分离多种实例类型: 标准版实例可选1GB64GB缓存容量 Cluster集群可选单分片1GB64GB缓存容量,分片数可选3256片 Proxy集群可选单分片1GB64GB缓存容量,分片数可选3256片 读写分离可选单节点1GB64GB, 副本数可选210 提供标准版、Cluster集群、Proxy集群、读写分离多种实例类型: 标准版可选4GB64GB缓存容量 Cluster集群可选单分片4GB64GB缓存容量,分片数可选3256片 Proxy集群可选单分片4GB64GB缓存容量,分片数可选3256片 读写分离可选单节点4GB64GB, 副本数可选210 提供单机、主备、集群多种实例类型: 单机、主备实例可选2GB32GB缓存容量 集群单机实例可选择16GB512GB 集群主备实例可选择16GB1024GB 功能区别 6.0/7.0版本支持账号权限管理 只支持单线程 支持SSL安全管理 支持账号权限管理 支持多线程 不支持SSL安全管理 集群版支持账号权限管理,单机、主备不支持 只支持单线程 不支持SSL安全管理
        来自:
        帮助文档
        分布式缓存服务Redis版
        产品介绍
        产品规格差异
        Redis版本类型差异
      • 步骤四:创建Schema
        当您关联MySQl实例后,还需要为DRDS实例创建Schema。 前提条件 DRDS实例已关联MySQL实例,且MySQL未处于只读状态。 注意事项 创建Schema时,DRDS将在关联的MySQL实例上新建数据库,该操作不会影响已有库表。 创建Schema时,一个DRDS实例可以创建多个Schema。 操作步骤 1. 进入Schema管理页面。 1. 在天翼云官网首页的顶部菜单栏,选择产品 > 数据库 > 关系型数据库 > 分布式关系型数据库 ,进入分布式关系型数据库产品页面。然后单击管理控制台 ,进入概览页面。 2. 在左侧导航栏,选择DRDS > 实例管理,进入实例列表页面。然后在顶部菜单栏,选择区域和项目。 3. 在实例列表中,找到目标实例,单击实例名称或单击操作 列的管理 ,进入实例基本信息页面。 4. 单击Schema管理页签,进入Schema管理页面。 2. 单击创建Schema ,进入创建Schema页面。 3. 在基本信息设置 页面,根据实际情况配置如下参数,然后单击下一步。 参数 说明 Schema名称 请以小写字母开头,长度为350个字符。 Schema字符集 支持选择utf8或utf8mb4。 注意 创建后不支持修改。 Schema引擎 支持选择InnoDB或MyISAM。 注意 创建后不支持修改。 关联数据库设置 选中作为存储节点的MySQL实例,并设置对应MySQL实例的分片数量。 4. 在分片节点设置 页面,设置数据库名称,然后单击下一步。 据库名称默认为Schema名称 数字编号,数字编号从1开始递增。您也可以根据需求设置MySQL实例中数据库名称。 5. 在创建页面,开始创建Schema。 您可以单击Schema管理 ,跳转到Schema管理 页面,也可以等待一段时间,系统将自动跳转到Schema管理页面。
        来自:
        帮助文档
        分布式关系型数据库
        快速入门
        步骤四:创建Schema
      • GPUStack产品使用手册
        GPUStack产品使用手册,含单机版和集群版(Worker、Server) 产品概述 1.1 产品介绍 GPUStack云服务是基于开源GPUStack构建的托管式AI模型部署平台,让您无需管理基础设施,即可在高性能GPU集群上轻松部署和运行各类AI模型,支持单机版和集群版(Worker、Server)。 单机版 集群版 面向用户 个人、中小团队或企业内部 企业研发团队、实验室、AI算力平台 适用场景 1. 个人开发者的大模型微调、推理效果验证 2. 小团队的算法原型开发、单卡模型性能测试 3. 教学科研场景的小规模 AI 实验 4. 临时算力需求(如短期模型 demo 制作) 1. 企业大模型训练 / 推理的规模化算力需求 2. 多团队共享 GPU 算力池的资源管控场景 3. 高并发模型服务(如智能客服等) 4. 异构 GPU 资源混合调度(支持 NVIDIA/昇腾等) 资源配置 单GPU服务器 Server节点:8C/16G 计算型服务器 Worker节点:1~N台GPU服务器(支持英伟达、昇腾等不同厂商GPU卡) 1.2 产品核心能力 资源管理:提供自动化GPU资源调度与集群管理,支持异构GPU设备统一纳管,实现资源利用率最大化与成本最优化; 模型部署:支持主流开源大模型一键部署,兼容Hugging Face、ModelScope等模型源,集成vLLM、SGLang和TensorRTLLM等高性能推理引擎,满足不同场景性能需求; 智能运维:内置自动扩缩容、故障转移与负载均衡机制,提供实时性能监控与告警,确保服务高可用性与稳定性; 安全管控:提供完善的认证授权体系与网络隔离策略,支持私有化部署与数据安全保障,满足企业级安全合规要求。
        来自:
        帮助文档
        轻量型云主机
        产品简介
        应用使用手册
        GPUStack产品使用手册
      • GPUStack产品使用手册(1)
        GPUStack产品使用手册,含单机版和集群版(Worker、Server) 产品概述 1.1 产品介绍 GPUStack云服务是基于开源GPUStack构建的托管式AI模型部署平台,让您无需管理基础设施,即可在高性能GPU集群上轻松部署和运行各类AI模型,支持单机版和集群版(Worker、Server)。 单机版 集群版 面向用户 个人、中小团队或企业内部 企业研发团队、实验室、AI算力平台 适用场景 1. 个人开发者的大模型微调、推理效果验证 2. 小团队的算法原型开发、单卡模型性能测试 3. 教学科研场景的小规模 AI 实验 4. 临时算力需求(如短期模型 demo 制作) 1. 企业大模型训练 / 推理的规模化算力需求 2. 多团队共享 GPU 算力池的资源管控场景 3. 高并发模型服务(如智能客服等) 4. 异构 GPU 资源混合调度(支持 NVIDIA/昇腾等) 资源配置 单GPU服务器 Server节点:8C/16G 计算型服务器 Worker节点:1~N台GPU服务器(支持英伟达、昇腾等不同厂商GPU卡) 1.2 产品核心能力 资源管理:提供自动化GPU资源调度与集群管理,支持异构GPU设备统一纳管,实现资源利用率最大化与成本最优化; 模型部署:支持主流开源大模型一键部署,兼容Hugging Face、ModelScope等模型源,集成vLLM、SGLang和TensorRTLLM等高性能推理引擎,满足不同场景性能需求; 智能运维:内置自动扩缩容、故障转移与负载均衡机制,提供实时性能监控与告警,确保服务高可用性与稳定性; 安全管控:提供完善的认证授权体系与网络隔离策略,支持私有化部署与数据安全保障,满足企业级安全合规要求。
        来自:
      • Hive扩容
        本章节主要介绍在Hive MetaStore实例进行Master扩容后,对其他相关服务的修改建议。 前置条件 1. Hive MetaStore完成扩容与配置生效操作。 2. 集群状态正常。 相关服务修改建议 Flink 如果用户配置了数据湖作业,那么就需要登录到所有的Flink client主机,在flink配置目录/user/local/flink/conf/中建立对/user/local/hive/conf/hivesite.xml的软链。 如果Hive MetaStore进行了节点扩容,需要更新该软链或文件,保证Flink使用到的是扩容后的hivesite.xml文件。 最后,根据扩容后的Hive MetaStore节点,更新数据湖作业中配置的hive.uri,并重启作业。 如果用户没有配置数据湖作业,则Flink不需要做任何操作。 Trino 通过翼MR Manager进入Trino集群的“配置管理”页面,修改hive.properties文件。 在参数hive.metastore.uri中按照实际情况填写metastore的地址;例如,三台Hive MetaStore的主机名为hostname1,hostname2,hostnam3,那么该配置的值应为thrift://hostname1:9083,thrift://hostname2:9083,hrift://hostname3:9083。 保存更改后,需要进行配置“同步”操作。 最后,重启Trino集群服务。 Spark 通过翼MR Manager进入Spark集群的“配置管理”页面,修改sparkdefaults.conf文件。 在参数spark.sql.catalog.sparkcatalog.uri中按照实际情况填写metastore的地址;例如,三台Hive MetaStore的主机名为hostname1,hostname2,hostnam3,那么该配置的值应为thrift://hostname1:9083,thrift://hostname2:9083,hrift://hostname3:9083。 保存更改后,需要进行配置“同步”操作。 最后,重启Spark集群服务。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        服务配置修改建议
        Master扩容-服务配置修改建议
        Hive扩容
      • 安全增强
        数据安全 针对海量用户数据,提供如下措施保障客户数据的机密性、完整性和可用性。 容灾:翼MR产品当前数据存放在天翼云云硬盘产品中,云硬盘采用三副本冗余机制,保障上层翼MR服务数据的高容灾型。 备份:翼MR产品当前数据存放在天翼云云硬盘产品中,云硬盘具备定期备份、数据恢复等特性。 数据完整性 通过数据校验,保证数据在存储、传输过程中的数据完整性。 用户数据保存在HDFS上,HDFS默认采用CRC32C校验数据的正确性。 HDFS的DataNode节点负责存储校验数据,如果发现客户端传递过来的数据有异常(不完整)就上报异常给客户端,让客户端重新写入数据。 客户端从DataNode读数据的时候会同步检查数据是否完整,如果发现数据不完整,尝试从其它的DataNode节点上读取数据。 数据保密性 天翼云大数据平台 翼MapReduce产品中的分布式文件系统采用Apache Hadoop 3.3.3版本,提供对文件内容的加密存储功能,避免敏感数据明文存储,提升数据安全性。业务应用只需对指定的敏感数据进行加密,加解密过程业务完全不感知。在文件系统数据加密基础上,Hive实现表级加密,HBase实现列族级加密,在创建表时指定采用的加密算法,即可实现对敏感数据的加密存储。 从数据的存储加密、访问控制来保障用户数据的保密性。 HBase支持将业务数据存储到HDFS前进行压缩处理,且用户可以配置AES和SMS4算法加密存储。 各组件支持本地数据目录访问权限设置,无权限用户禁止访问数据。 所有集群内部用户信息提供密文存储。
        来自:
        帮助文档
        翼MapReduce
        产品介绍
        功能特性
        安全增强
      • 定时任务
        本节介绍了定时任务的用户指南。 基本概念 定时任务:即kubernetes中的“CronJob”,定时任务是按照指定时间周期运行的短任务。使用场景为在某个固定时间点,为所有运行中的节点做时间同步。 操作场景 定时任务是按照指定时间周期运行的短任务。使用场景为在某个固定时间点,为所有运行中的节点做时间同步。 定时任务是基于时间的Job,就类似于Linux系统的crontab,在指定的时间周期运行指定的Job,即:在给定时间点只运行一次。在给定时间点周期性地运行。 CronJob的典型用法如下所示:在给定的时间点调度Job运行。创建周期性运行的Job,例如数据库备份、发送邮件。 前提条件 在创建定时任务前,您需要存在一个可用集群。若没有可用集群,请参照集群开通中内容创建。 操作步骤及说明 创建CronJob与创建Deployment的过程类似,但存在以下的差异,需要注意: 定时任务的执行策略 执行策略:选择CronJob的执行周期,即每隔这个时间周期CronJob就会执行一次 并发策略:CronJob是周期性执行的,那么可能存在一种情形是上一周期中任务还没有执行完,但是已经到了下一个时间周期,并发策略用于设置这种情形下的CronJob怎么执行: 允许:让这两个周期的任务同时存在,并发执行 禁止:下一个时间周期的任务不执行 替换:停止行一个周期的任务,开始执行下一个时间周期的任务 Job参数 用于设置定时任务中任务的参数:
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        工作负载(旧版)
        定时任务
      • 游戏行业最佳实践
        本文介绍AOne在游戏行业的最佳实践。 背景信息 游戏行业是一个高度竞争和快节奏的行业,吸引了大量的在线玩家。在这个行业中,游戏运营商需要提供高性能、稳定可靠的游戏体验,同时保护游戏服务器和用户数据免受安全威胁。游戏服务的安全和性能直接影响到用户满意度、用户留存率以及游戏收入。为了满足游戏行业的挑战,许多游戏运营商都在寻求安全与加速服务解决方案来保护游戏服务器和提高游戏性能。 天翼云边缘安全加速平台AOne基于DDoS攻击防护、CC攻击防护和高性能CDN动静态加速能力,保障游戏的稳定性和可用性。 技术架构 应用场景 在线多人游戏服务器的安全防护 业务挑战:在线多人游戏服务器常常成为DDoS攻击和CC攻击的目标,这些攻击可能导致游戏服务器的过载和服务不可用,影响玩家的游戏体验。 方案优势:AOne提供强大的DDoS防护和CC攻击防御功能,可以实时监测和过滤恶意流量,确保游戏服务器免受攻击。这样可以保障游戏的稳定性和可用性,提高在线游戏的安全性。 在线游戏内容的全球加速传输 业务挑战:玩家分布在全球各地,下载游戏客户端或更新内容时,可能会面临较长的下载时间和高延迟。 方案优势:通过内容分发网络(CDN)技术,AOne在全球各地部署服务器节点,将游戏的静态资源缓存在离玩家最近的节点上。这样可以大大减少资源加载时间和延迟,提高玩家下载游戏内容的速度,优化玩家的游戏体验。
        来自:
        帮助文档
        边缘安全加速平台
        最佳实践
        行业最佳实践
        游戏行业最佳实践
      • IIS部署SSL证书
        本文档指导您如何在IIS服务器中部署SSL证书。 前提条件 已在当前服务器中安装配置IIS服务。 说明 由于服务器系统版本或服务器环境配置不同,在安装SSL证书过程中使用的命令或修改的配置文件信息可能会略有不同,证书管理服务提供的安装证书示例,仅供参考,请以您的实际情况为准。 部分服务端直接导入IIS可能会存在问题,所以本章节的操作步骤为:导入到Microsoft管理控制台 > 导入IIS服务端。 文件准备 在证书管理服务控制台的证书管理页选择您需要安装的证书,选择“证书下载”。 在弹出的 “证书下载” 窗口中,服务器类型选择 IIS,单击“下载”并解压缩包至本地,文件内包含下述2个文件: PFX证书密码: README.txt PFX格式证书: XXXX.cn.pfx 导入证书至系统 1. 使用“Win + R”快捷键组合打开“运行”控制台,输入“mmc”打开“Microsoft 控制台”。 2. 单击右上角的“文件”选择“添加/删除管理单元”。 3. 在“可用管理单元”中选择“证书”,并单击“添加”。 4. 在弹出的对话框中选择“计算机账户”,单击“下一页”后再选择“本地计算机”,单击“完成”将证书模块添加至控制台根节点中。 5. 在“控制台根节点”中选择“证书 > 个人”,在“对象类型”页面单击右键,选择“所有任务 > 导入”。 6. 选择“文件准备”章节中下载的PFX文件,单击“下一步”后选择“证书存储个人”完成证书导入。 7. 调整证书链,将中级证书剪切到 “中级证书颁发机构”下的“证书”中。
        来自:
        帮助文档
        证书管理服务
        用户指南
        SSL证书
        安装SSL证书
        安装SSL证书至服务器
        IIS部署SSL证书
      • 如何实现RabbitMQ的高性能
        RabbitMQ sharding 该插件自动对队列进行分区,也就是说,一旦您将一个交换器定义为sharded,那么在每个集群节点上自动创建支持队列,并在它们之间共享消息。该插件提供了一个集中发送消息的位置,并通过向集群中的其他节点添加队列,实现负载均衡。使用此插件时,需要确保消费者从所有队列中消费。 配置RabbitMQ sharding插件的步骤如下: 1. 创建xmodulushash属性交换器。 2. 为该交换器添加策略。 3. 单击该交换器详情,查看是否配置成功。 自动删除不再使用的队列 客户端可能连接失败导致队列被残留,大量的残留队列会影响实例的性能。RabbitMQ提供三种自动删除队列的方法: 在队列中设置TTL策略:例如TTL策略设置为28天,当持续28天队列未被使用时,此队列将被删除。 使用autodelete队列:当最后一个消费者退出或通道/连接关闭(或与服务器的TCP连接丢失)时,autodelete队列会被删除。 使用exclusive queue:exclusive queue只能在创建它的连接中使用,当此连接关闭或消失时,exclusive queue会被删除。 设置方法如下: boolean exclusive true; boolean autoDelete true; channel.queueDeclare(QUEUENAME, durable, exclusive, autoDelete, arguments); 限制使用优先队列的数量 每个优先队列会启动一个Erlang进程,过多的优先队列会影响性能。在大多数情况下,建议使用不超过5个优先队列。
        来自:
        帮助文档
        分布式消息服务RabbitMQ
        最佳实践
        如何实现RabbitMQ的高性能
      • ALM-14028 待补齐的块数超过阈值
        可能原因 DataNode实例异常。 数据被删除。 写入文件的副本数大于DataNode的节点数。 处理步骤 1.在FusionInsight Manager首页,选择“运维 > 告警 > 告警”查看是否存在告警“ALM14003 丢失的HDFS块数量超过阈值”。 是,执行步骤2。 否,执行步骤3。 2.按照“ALM14003 丢失的HDFS块数量超过阈值”的处理方法处理,然后等待5分钟,检查告警是否清除。 是,结束。 否,执行步骤3。 3.以root用户登录HDFS客户端,用户密码为安装前用户自定义,请咨询系统管理员。执行如下命令: 安全模式: cd 客户端安装目录 source bigdataenv kinit hdfs 普通模式: su omm cd 客户端安装目录 source bigdataenv 4.执行命令 hdfs fsck / >> fsck.log ,获取当前集群的状况。 5.使用命令统计当前待复制块数量M: cat fsck.log grep "Underreplicated" 6.使用命令统计“/tmp/hadoopyarn/staging/”目录下的待复制块数量N: cat fsck.log grep "Under replicated" grep "/tmp/hadoopyarn/staging/" wc l 说明 “/tmp/hadoopyarn/staging/”目录为默认值,如果客户有修改,可以通过mapredsite.xml文件配置项“yarn.app.mapreduce.am.stagingdir”获取此路径。 7.比对N是否占了M的大多数(N/M>50%)。 是,执行步骤8。 否,执行步骤9。 8.执行命令来重新配置目录的文件副本数(文件副本数选择DataNode节点数或者默认文件副本数): hdfs dfs setrep w 文件副本数 /tmp/hadoopyarn/staging/ 说明 默认文件副本数通过如下方式获取: 登录Manager页面,选择“集群 > 服务 > HDFS > 配置 > 全部配置”,搜索dfs.replication参数,该参数的值即是默认文件副本数。 然后等待5分钟,检查告警是否清除。 是,结束。 否,执行步骤9。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-14028 待补齐的块数超过阈值
      • 设置磁盘自动扩容
        本节介绍了设置磁盘自动扩容的操作场景、约束限制和操作步骤等内容。 操作场景 RDS for MySQL云盘实例支持存储空间自动扩容,在实例存储空间达到阈值时,会触发自动扩容。 只读实例设置自动扩容与主实例自动扩容互不影响,因此,您需要单独为只读实例设置扩容,以满足业务需求。对只读实例设置自动扩容时,您可选择大于或等于主实例的存储空间。 约束限制 云数据库 RDS for MySQL实例最大可自动扩容至4000GB。 如果是主备实例,针对主节点设置自动扩容时,会同时对其备节点生效。 实例在进行规格变更、内核小版本升级、备机迁移、重启时,不能进行此操作。 该功能目前已上线苏州、广州、华北。 操作步骤 步骤 1 登录管理控制台。 步骤 2 单击管理控制台左上角的 ,选择区域。 步骤 3 选择“数据库 > 关系型数据库”。进入关系型数据库信息页面。 步骤 4 在“实例管理”页面,单击目标实例或只读实例名称,进入“基本信息”页面,可通过单击实例名称前的 查看到只读实例。 步骤 5 在“存储空间”模块,打开“磁盘自动扩容”开关。 步骤 6 在“存储空间自动扩容”弹框,设置如下参数: 表 参数说明 类别 说明 存储空间自动扩容 存储空间自动扩容开关。 可用存储空间率 当可使用存储空间百分比小于等于该阈值时或者10GB时,会触发自动扩容。 存储自动扩容上限 自动扩容上限,默认取值:40~4000,单位:GB。需要大于等于实例当前存储空间总大小。 步骤 7 单击“确定”。 结束
        来自:
        帮助文档
        关系数据库MySQL版
        用户指南
        实例管理
        设置磁盘自动扩容
      • 步骤一:创建实例
        参数 描述 区域 租户当前所在区域,也可在页面左上角切换。 说明 不同区域内的产品内网不互通,且购买后不能更换,请谨慎选择。 实例名称 实例名称长度在4个到64个字符之间,必须以字母开头,可以包含字母、数字、中划线或下划线,不能包含其他特殊字符。 数据库引擎 MySQL。 数据库版本 不同区域所支持的数据库版本不同,请以实际界面为准。 选用MySQL数据库时,请根据实际业务需求选择合适的数据库引擎版本。建议您选择当前可用的最高版本数据库,因其性能更稳定,安全性更高,使用更可靠。 实例类型+可用区 主备:备机提高了实例的可靠性,创建主机的过程中,同步创建备机,备机创建成功后,用户不可见。 可用区指在同一区域下,电力、网络隔离的物理区域,可用区之间内网互通,不同可用区之间物理隔离。 关系型数据库服务支持在同一个可用区内或者跨可用区部署数据库主备实例,备机的选择和主机可用区对应情况: − 相同,主机和备机会部署在同一个可用区。 − 不同(默认),主机和备机会部署在不同的可用区,以提供不同可用区之间的故障转移能力和高可用性。 单机:采用单个数据库节点部署架构,与主流的主备实例相比,它只包含一个节点,但具有高性价比。适用于个人学习、微型网站以及中小企业的开发测试环境。 时区 由于世界各国家与地区经度不同,地方时也有所不同,因此会划分为不同的时区。时区可在创建实例时选择,后期可修改。
        来自:
        帮助文档
        关系数据库MySQL版
        快速入门
        通过内网连接MySQL实例
        步骤一:创建实例
      • 使用CDN后,客户端访问浏览器提示跨域异常
        本文介绍使用CDN后,当客户端访问浏览器提示跨域异常可能的原因及解决方案。 可能的原因:跨域请求的资源在CDN节点没有响应消息头部:AccessControlAllowOrigin,或响应了该头部,但是值与请求头中的Origin值不匹配。建议您根据域名需求配置跨域资源共享,详情请见:跨域资源共享。 注意 为防止因浏览器缓存导致报跨域错误,在CDN加速控制台配置完跨域请求头“AccessControlAllowOrigin”后,请您及时清理浏览器缓存。
        来自:
        帮助文档
        CDN加速
        常见问题
        回源相关
        使用CDN后,客户端访问浏览器提示跨域异常
      • 产品动态
        时间节点 功能名称 功能描述 相关文档 2024/01/10 支持IAM授权和企业项目授权 在企业项目授权的基础上,新增IAM授权,支持对全局或资源池范围上的云服务资源进行授权。 2024/01/10 支持用户SSO的身份联合认证 支持通过SMAL协议,以IAM用户SSO类型完成身份联合认证。 2024/01/10 统一身份认证控制台上线 统一身份认证是天翼云提供权限管理的基础服务,可以帮助您安全地控制天翼云服务和资源的访问权限。
        来自:
        帮助文档
        统一身份认证(一类节点)
        产品动态
        产品动态
      • 计费项
        计费项 计费项说明 计费方式 备注 IaaS云资源 ELB 按需计费 必须,绑定 API Server 使用。 计费信息参见 IaaS云资源 EIP 按需计费 非必须,公网暴露 API Server 使用。 计费信息参见 IaaS云资源 ECS 按需计费 非必须,注册集群节点扩容使用。 计费信息参见
        来自:
        帮助文档
        分布式容器云平台 CCE One
        计费说明
        计费项
      • 1
      • ...
      • 169
      • 170
      • 171
      • 172
      • 173
      • ...
      • 230
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云信创专区

      “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      多活容灾服务 MDR

      镜像服务 IMS

      弹性伸缩服务 AS

      AI Store

      应用托管

      一站式智算服务平台

      智算一体机

      知识库问答

      人脸检测

      推荐文档

      其他问题

      快速登录

      产品定义

      产品功能

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号