云主机开年特惠28.8元/年,0元秒杀等你来抢!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 天翼云新春焕新季 NEW 云主机开年特惠28.8元/年,0元秒杀等你来抢!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      VPC终端节点_相关内容
      • 管理私有资源组
        扩缩容节点集群 1、登录性能测试控制台,在左侧导航栏中选择“测试资源”。 2、在资源组列表中,单击待操作的资源组中的“资源调整”。 3、扩缩容节点集群。 扩容资源组:在“资源调整”对话框中,单击待修改资源组后的“扩缩容”,在“选择执行节点”对话框中,勾选当前已存在的执行节点+需要扩容的执行节点,单击“选择”。 减容资源组:在“资源调整”对话框中,单击待修改资源组后的“扩缩容”,在“选择执行节点”对话框中,勾选需要保留的执行节点,单击“选择”。 查看私有资源组信息 1、登录性能测试控制台,在左侧导航栏中选择“测试资源”。 2、在资源组列表中,可查看到如下表所示的私有资源组信息。 私有资源组信息说明 信息名称 信息说明 私有资源组名称 创建私有资源组时输入的名称。 私有资源组状态 部署中运行中需升级异常 执行器数 占用执行器数/执行器总数。单执行器支持并发:HTTP/HTTPS(5000),WebSocket(5000),JMeter(1000),HLS/RTMP/HTTPFLV(1000)。 当前并发 当前私有资源组内所有节点集群当前并发相加的和。 调试节点 创建私有资源组时选择的调试节点。 执行节点 资源组内所有节点集群的执行节点。单击“更多”,可以查看到该资源组全部执行节点。 创建时间 私有资源组创建的时间。 修改时间 私有资源组最后一次修改的时间。
        来自:
        帮助文档
        性能测试PTS
        用户指南
        测试资源管理
        管理私有资源组
      • 探测节点:查询列表
        参数 参数类型 说明 示例 下级对象 mongoID String 数据库ID 635a4a3869bdc841ab0495dd ID String 探测节点唯一ID 1 name String 探测节点名称 NeiMeng hermesRegion String region名称 neimengaz03 position String 探测节点区域 内蒙 status Boolean 探测节点是否可用 true
        来自:
        帮助文档
        云监控服务
        API参考
        API
        监控服务
        站点监控
        探测节点:查询列表
      • 节点DNS检查
        本文主要介绍节点DNS检查. 检查项内容 当前检查项包括以下内容: 检查当前节点DNS配置是否能正常解析OBS地址 检查当前节点是否能访问存储升级组件包的OBS地址 解决方案 节点升级过程中,需要从OBS拉取升级组件包。此项检查失败,请联系技术人员支持。
        来自:
        帮助文档
        云容器引擎
        用户指南
        集群管理
        集群升级
        升级前检查
        节点DNS检查
      • autoscaler
        参数 支持的插件版本 参数说明 插件规格 所有版本 插件部署可选择“单实例”和“高可用”两种规格。 单实例:以单实例部署插件。 高可用:以多实例部署插件,具有高可用能力,需占用更多的计算资源。 实例数 所有版本 选择上方插件规格后,显示插件中的实例数,此处仅作显示。 容器 所有版本 选择插件规格后,显示插件容器的CPU和内存配额,此处仅作显示。 登录方式 部分版本无此参数 为自动扩容工作节点选择登录方式,当前支持“密码”和“密钥对”两种方式,您可根据需要进行选择。 选择“密码”方式: 密码:自动扩容工作节点密码。通过该密码登录工作节点执行相关操作,用户名为root。 确认密码:再次输入自动扩容工作节点密码。 选择“密钥对”方式: 密钥对:密钥对用于远程登录节点时的身份认证。 自动缩容 所有版本 默认不开启:将不开启自动缩容,只进行自动扩容。 开启:开启自动缩容,且自建节点和插件扩容所创建的节点均可缩容。 空置时间(min):当集群节点处于一段时间的空闲状态时,会触发集群缩容操作,删除节点,默认10min。 百分比:当集群节点资源低于多少百分比时,进行集群缩容扫描(默认0.5,即50%,cpu和mem都要满足的条件下才会缩容)。 扩容后缩容冷却时间:扩容执行后能再次启动缩容评估的时间间隔,默认10min。 节点删除后缩容冷却时间:删除节点后能再次启动缩容评估的时间间隔,默认10min。 缩容失败后缩容冷却时间:缩容失败后能再次启动缩容评估的时间间隔,默认3min。 空节点缩容最大并发数:默认10。 不可移除节点的重检查时间:节点被判定不可移除后能再次启动检查的时间间隔,默认5min。 说明 当节点处于以下几种状态时,不可缩容: a、pod设置为PodDisruptionBudget,当不满足条件时,节点不会缩容。 b、pod设置本地存储时,节点不会缩容。 c、pod由于一些限制,如亲和、反亲和等,无法调度到其他节点,节点不会缩容。 d、pod拥有clusterautoscaler.kubernetes.io/safetoevict: 'false'这个annotations时,节点不缩容。 e、节点上存在kubesystem命名空间下的Pod(除kubesystem daemonset创建的Pod)。 f、节点上有非controller(deployment/replica set/job/stateful set)创建的Pod。 预置节点池配置 部分版本无此参数 此为默认资源组。集群扩容时,若没有其他可用分组,将使用默认分组的资源规格进行扩容节点。 单击“添加预置节点池配置”进行参数设置: 可用区:选择一个可用区。可用区是指在同一区域下,电力、网络隔离的物理区域。 操作系统:选择节点对应的操作系统。 Taints:可选项,默认为空。 支持给该节点池扩容出来的节点加Taints来设置反亲和性,每个节点池最多配置10条Taints,每条Taints包含以下3个参数: − Key:必须以字母或数字开头,可以包含字母、数字、连字符、下划线和点,最长63个字符;另外可以使用DNS子域作为前缀。 − Value:必须以字母或数字开头,可以包含字母、数字、连字符、下划线和点,最长63个字符。 − Effect:只可选NoSchedule,PreferNoSchedule或NoExecute。 须知: 1、Taints配置时需要配合Pod的toleration使用,否则可能导致扩容失败或者Pod无法调度到扩容节点。 2、配置后无法修改,请您谨慎配置,错误的配置可能会导致扩容失败或pod无法调度。 3、标签管理:通过为资源添加标签,可以对资源进行自定义标记,实现资源的分类。 说明 您可以在TMS中创建“预定义标签”,预定义标签对所有支持标签功能的服务资源可见,通过使用预定义标签可以提升标签创建和迁移效率。 节点规格:节点的CPU配置和内存配置。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        插件管理
        autoscaler
      • 支持的监控指标
        本文主要介绍 支持的监控指标。 功能说明 本章节定义了分布式消息服务Kafka上报云监控服务的监控指标的命名空间,监控指标列表和维度定义,您可以通过云监控服务的管理控制台或API接口来检索Kafka实例产生的监控指标和告警信息,也可以通过分布式消息服务Kafka控制台提供的“监控”页面来检索Kafka实例产生的监控指标。 命名空间 SYS.DMS 实例监控指标 表 实例支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) currentpartitions 分区数 该指标用于统计Kafka实例中已经使用的分区数量。单位:Count 0~1800 Kafka实例 1分钟 currenttopics 主题数 该指标用于统计Kafka实例中已经创建的主题数量。单位:Count 0~1800 Kafka实例 1分钟 groupmsgs 堆积消息数 该指标用于统计Kafka实例中所有消费组中总堆积消息数。单位:Count 0~1000000000 Kafka实例 1分钟 节点监控指标 表 节点支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) brokerdatasize 节点数据容量 该指标用于统计节点当前的消息数据大小。单位:Byte、KB、MB、GB、TB、PB 0~5000000000000 Kafka实例节点 1分钟 brokermessagesinrate 消息生产速率 该指标用于统计每秒生产的消息数量。单位:Count/s 0~500000 Kafka实例节点 1分钟 brokerbytesoutrate 消费流量 该指标用于统计每秒消费的字节数。单位:Byte/s、KB/s、MB/s、GB/s 0~500000000 Kafka实例节点 1分钟 brokerbytesinrate 生产流量 该指标用于统计每秒生产的字节数。单位:Byte/s、KB/s、MB/s、GB/s 0~500000000 Kafka实例节点 1分钟 brokerpublicbytesinrate 公网入流量 统计Broker节点每秒公网访问流入流量。单位:Byte/s、KB/s、MB/s、GB/s 说明 已开启公网访问,并且设置了弹性IP地址的实例,请在弹性公网IP服务中查看此监控指标。 0~500000000 Kafka实例节点 1分钟 brokerpublicbytesoutrate 公网出流量 统计Broker节点每秒公网访问流出流量。单位:Byte/s、KB/s、MB/s、GB/s 说明 已开启公网访问,并且设置了弹性IP地址的实例,请在弹性公网IP服务中查看此监控指标。 0~500000000 Kafka实例节点 1分钟 brokerfetchmean 消费请求平均处理时长 统计Broker节点处理消费请求平均时长。单位:ms 0~10000 Kafka实例节点 1分钟 brokerproducemean 生产请求平均处理时长 统计Broker节点处理生产请求平均时长。单位:ms 0~10000 Kafka实例节点 1分钟 brokercpucoreload CPU核均负载 该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。单位:% 0~20 Kafka实例节点 1分钟 brokerdiskusage 磁盘容量使用率 该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。单位:% 0~100% Kafka实例节点 1分钟 brokermemoryusage 内存使用率 该指标为Kafka节点虚拟机层面采集的内存使用率。单位:% 0~100% Kafka实例节点 1分钟 brokerheapusage Kafka进程JVM堆内存使用率 该指标从Kafka节点Kafka进程JVM中采集的堆内存使用率。单位:% 0~100% Kafka实例节点 1分钟 brokeralive 节点存活状态 表示Kafka节点是否存活。 1:存活 0:离线 Kafka实例节点 1分钟 brokerconnections 连接数 统计Kafka节点当前所有TCP连接数量。单位:Count 0~65535 Kafka实例节点 1分钟 brokercpuusage CPU使用率 统计Kafka节点虚拟机的CPU使用率。单位:% 0~100% Kafka实例节点 1分钟 brokerdiskreadawait 磁盘平均读操作耗时 该指标用于统计磁盘在测量周期内平均每个读IO的操作时长。单位:ms >0 Kafka实例节点 1分钟 brokerdiskwriteawait 磁盘平均写操作耗时 该指标用于统计磁盘在测量周期内平均每个写IO的操作时长。单位:ms >0 Kafka实例节点 1分钟 brokertotalbytesinrate 网络入流量 统计Broker节点每秒网络访问流入流量。单位:Byte/s 0~1000000000 Kafka实例节点 1分钟 brokertotalbytesoutrate 网络出流量 统计Broker节点每秒网络访问流出流量。单位:Byte/s 0~1000000000 Kafka实例节点 1分钟 brokerdiskreadrate 磁盘读流量 磁盘读操作流量。单位:Byte/s、KB/s、MB/s、GB/s >0 Kafka实例节点 1分钟 brokerdiskwriterate 磁盘写流量 磁盘写操作流量。单位:Byte/s、KB/s、MB/s、GB/s >0 Kafka实例节点 1分钟
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        监控
        支持的监控指标
      • 容灾策略
        分布式缓存Redis实例存储着大量业务关键数据,在数据库前端缓存、数据存储引擎等各类场景下,数据的可靠性与服务的连续可用性是客户考虑的重要因素。根据对数据与服务的不同可靠性要求,您可以选择将缓存实例部署在单可用区内(单机房),或者跨可用区(同城灾备)。 单资源池单可用区高可用 单可用区灾备策略主要包括进程/服务高可用与数据持久化到磁盘两个方面进行。在单个可用区内,单机或集群单机实例通过进程守护的方式来确保服务的高可用性。当分布式缓存系统监测到Redis实例的进程出现故障时,它会立即启动一个新的进程,以继续提供服务 标准版主备配置包括数据持久化功能,该功能不仅将数据持久化到主节点的磁盘上,还会进行增量同步到备节点,并且备节点也会独立地持久化一份数据。主节点负责处理日常的服务请求,但如果主节点发生故障并满足切换条件,检测进程会进行主备自动切换,即将备节点提升为新的主节点,以实现故障转移并保证高可用性,确保业务的平稳运行。对于原本故障的主节点,在其恢复后,其状态将被更新为备节点。 集群主备实例与标准主备实例类似,其中每个分片节点都拥有持久化文件,并且集群中的每个分片都有自己的主节点和备节点。每个分片独立进行主节点状态检测,如果某个分片的主节点发生故障且满足切换条件,检测进程将把备节点提升为新的主节点,即进行主备切换操作。原本故障的主节点在恢复后,其状态将被更新为备节点。
        来自:
        帮助文档
        分布式缓存服务Redis版
        产品介绍
        安全
        容灾策略
      • 排查集群实例负载不均衡问题
        本页介绍了如何排查集群实例负载不均衡问题原因与解决方法。 集群负载不均衡原因与排查方法 : 数据分布不均:集群中的数据分布不均可能导致某些节点负责处理更多的数据请求,而其他节点处于较轻的负载状态。使用sh.status()命令查看分片集群的状态,确保数据在分片键上均匀分布。 索引不匹配:不同节点的索引设置可能不同,导致查询在某些节点上效率较低。确认每个节点的索引设置是否一致,特别是涉及查询的字段上是否存在索引。 写入偏向:如果所有写入请求都集中在一个节点上,那么该节点可能会出现较高的负载。考虑使用"Write Concern"参数或"Read Preference"参数来分散写入请求。 查询模式:集群中可能有某些查询模式导致某些节点的负载较高。使用db.currentOp()命令查看当前正在执行的查询,分析是否有查询消耗大量资源。 数据热点:某些数据区域可能比其他区域更活跃,导致数据热点。使用db.collection.stats()命令查看集合的统计信息,查找是否存在数据热点。 硬件性能:集群中的节点硬件性能可能不均衡,导致某些节点的处理能力较弱。确保所有节点的硬件配置相似,并且能够满足负载要求。 客户端连接:集群中某些节点的连接数可能较高,导致负载不均衡。使用db.serverStatus().connections命令查看每个节点的连接数。 数据迁移:如果最近进行了数据迁移或重分片操作,可能导致负载不均衡。确保迁移操作已经完成,并且数据均匀分布。 故障节点:某些节点可能由于故障或不可用导致负载不均衡。检查集群的状态,确认所有节点都处于正常运行状态。
        来自:
        帮助文档
        文档数据库服务
        用户指南
        性能调优
        排查集群实例负载不均衡问题
      • 实例变更
        本页面介绍了与实例变更相关的内容。 实例扩缩容与节点变更 存储空间扩容 具体操作为步骤如下: 1. 进入云数据库ClickHouse管理控制台,点击需要变更实例的“更多”选项。 2. 选择“计算节点存储空间扩容”。 扩容存储空间:需扩容的存储空间,步长10G,最大32000G。 包周期实例页面所显示的费用合计是本次扩容所需支付费用,按需实例无需支付费用,将在下一个扣费周期(每小时)按照新配置进行计费。 规格扩容 具体操作为步骤如下: 1. 进入云数据库ClickHouse管理控制台,点击需要变更实例的“更多”选项。 2. 按照需要扩容的节点选择“计算节点规格扩容”或“协调节点规格扩容”。 变更配置:CPU/内存只能升级不能降级;支持的规格有四种:4C16G、8C32G、16C64G、32C128G。 规格 可变范围 4C16G 8C32G、16C64G、32C128G 8C32G 16C64G、32C128G 16C64G 32C128G 包周期实例页面所显示的费用合计是本次扩容所需支付费用,按需实例无需支付费用,将在下一个扣费周期(每小时)按照新配置进行计费。 计算节点增加 具体操作为步骤如下: 1. 进入云数据库ClickHouse管理控制台,点击需要变更实例的“更多”选项。 2. 选择“计算节点增加”。 变更配置:增加后的总节点数,节点数只能增加不能减少,最多增加至48个节点。单副本:节点总数的范围为248,节点总数增加步长为1。双副本单可用区:双副本的节点总数的范围为248,节点总数增加步长为2。双副本三可用区:双副本的节点总数的范围为648,节点总数增加步长为6。
        来自:
        帮助文档
        云数据库ClickHouse
        用户指南
        集群管理
        实例变更
      • 获取PostgreSQL实例的节点列表
        名称 二级节点 类型 说明 message String 消息提示 statusCode Integer 状态码 returnObj Array 所有的返回信息都以JSON形式保存 prodInstId Long 实例id nodeId Long 数据库资源id host String 数据库节点地址 port Integer 数据库节点端口 primary Integer 是否为主节点 1:是 0:不是 expireTime Long 过期时间 prodInstFlag String 数据库类型
        来自:
        帮助文档
        关系数据库PostgreSQL版
        API参考
        API
        实例
        获取PostgreSQL实例的节点列表
      • 通过引导操作安装第三方软件
        在弹性伸缩集群页面添加自动化脚本 1.登录MRS管理控制台。 2.选择“集群列表 > 现有集群”,选中一个运行中的集群并单击集群名称。进入集群详情页面。 3.在“节点管理”页签Task节点组的“操作”列单击“弹性伸缩”,进入“弹性伸缩”页面。 当集群没有Task节点时,先单击“配置Task节点”增加Task节点,再执行该步骤。 说明 对于MRS 3.x及之后版本,“配置Task节点”仅适用于分析集群、流试集群和混合集群。 4.配置资源计划。 配置操作: a.在弹性伸缩页面,开启弹性伸缩功能。 b.节点数量范围的“默认范围”设置为“22”,表示除资源计划规定时间范围外,其他时间Task节点数量固定为2个。 c.单击默认范围下方的“配置指定时间段的节点数量范围”。 d.配置“时间范围”和“节点数量范围”。此处“时间范围”设置为“07:0013:00”,“节点数量范围”设置为“55”,表示在该时间范围内,Task节点数量固定为5个。参数详情请参考 配置弹性伸缩规则章节表格资源计划配置项说明。 可以单击“配置指定时间段的节点数量范围”配置多条资源计划。 5.(可选)配置自动化脚本。 a.在“高级配置”项选择“现在配置”。 b.单击“添加”,进入“自动化脚本”配置页面。 c.配置“名称”、“脚本路径”、“执行节点类型”、“参数”、“执行时机”、“失败操作”。参数详情请参考 配置弹性伸缩规则章节表格自动化脚本配置说明。 d.单击“确定”保存自动化脚本配置。 6.勾选“我同意授权MRS服务根据以上策略自动进行节点扩容/缩容操作。”。 7.单击“确定”,完成弹性伸缩集群设置。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        配置集群
        通过引导操作安装第三方软件
      • 配置升级
        本章节主要介绍翼MapReduce服务如何升级节点配置。 当master、core或者task节点的规格(vCPU和内存)无法满足您的业务需求时,您可以使用配置升级功能提升节点规格。 背景信息 配置升级前需要前往Manager“集群服务—更多操作—停止所有集群服务”,手动关闭大数据集群服务。 操作步骤 1. 登录翼MapReduce管理控制台。 2. 从“我的集群”中 ,选中一个运行中的集群并单击集群名称,进入集群信息页面。 3. 选择“节点管理”,在需要升级配置的节点组的“操作”列并单击“配置升级”,进入升级节点配置页面。只有运行中的集群才能进行配置升级操作。 4. 配置升级前需要前往Manager “集群服务—更多操作—停止所有集群服务”,手动关闭大数据集群服务,否则无法执行配置升级操作。 5. 在配置升级页面,选择“升级后配置”,确认配置升级金额,勾选协议,并单击确定。 6. 配置升级完成后,您可以按需前往Manager的"配置管理”页面进行配置更改。可以参考配置升级服务配置修改建议。配置修改完成后,要前往Manager“集群服务—更多操作—启动所有集群服务”手动拉起大数据集群服务。 说明 集群正在升级配置时,不支持进行升级节点配置/节点扩容/磁盘扩容等运维操作。 配置升级的操作会被记录在“集群日志”中,可以通过“状态”变化查看配置升级是否执行成功。 配置升级成功后,可以在“节点管理”查看集群的节点信息。 配置升级前一定要停止集群服务,否则无法执行配置升级操作。 配置升级时不能进行IAM用户同步操作,若操作IAM用户同步会出现同步失败。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        管理集群
        节点管理
        配置升级
      • 实例生命周期管理
        重启集群节点 步骤 1 登录管理控制台。 步骤 2 单击管理控制台左上方的,选择区域和项目。 步骤 3 在页面左上角单击,选择“数据库 > 文档数据库服务 DDS”,进入文档数据库服务信息页面。 步骤 4 在“实例管理”页面,选择指定的集群实例,单击实例名称。 步骤 5 在“基本信息”页面的“节点信息”处,选择“mongos”、“shard”或“config”,在“操作”列单击“重启”。 重启mongos节点 步骤 6 在弹出框中,单击“是”,重启对应组下的所有角色。 步骤 7 查看节点状态。 重启过程中,该节点和其所在实例的运行状态都为“重启中”,并且该节点所在实例,以及实例中的其他节点,暂不可重启。 重启副本集只读节点 步骤 1 登录管理控制台。 步骤 2 单击管理控制台左上方的,选择区域和项目。 步骤 3 在页面左上角单击,选择“数据库 > 文档数据库服务 DDS”,进入文档数据库服务信息页面。 步骤 4 在“实例管理”页面,选择指定的副本集实例,单击实例名称。 步骤 5 在“基本信息”页面的“节点信息”处,选择“只读节点”,在“操作”列单击“更多”。 选择只读节点 步骤 6 选择“重启”。 重启只读节点 步骤 7 在弹出框中,单击“是”,重启所选择的只读节点。 步骤 8 查看节点状态。 重启过程中,该节点和其所在实例的运行状态都为“重启中”,并且该节点所在实例,以及实例中的其他节点,暂不可重启。 删除按需实例 对于“按需计费”模式的数据库实例,您可根据业务需要,在“实例管理”页面手动删除来释放资源。删除实例后,实例下所有节点将同步被删除。
        来自:
        帮助文档
        文档数据库服务
        用户指南
        实例生命周期管理
      • ALM-12066 节点间互信失效
        本章节主要介绍 ALM12066 节点间互信失效。 告警解释 系统每一个小时检查一次主OMS节点和其他Agent节点间的互信是否正常,如果存在互信失效的节点,则发送告警。待客户修复改问题,该告警会自动清除。 告警属性 告警ID 告警级别 是否自动清除 12066 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群或系统名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 可能会导致管理面的一些操作异常。 可能原因 /etc/ssh/sshdconfig配置文件被破坏。 omm密码过期。 处理步骤 查看/etc/ssh/sshdconfig配置文件状态 1.打开FusionInsight Manager页面,在告警列表中,单击此告警所在行的,查看告警详情中涉及的主机列表。 2.以omm用户登录主OMS管理节点。 3.依次在告警详情中的节点执行ssh 命令:ssh host2 (host2为告警详情中OMS节点之外的其它节点),看是否连接失败。 是,执行步骤4。 否,执行步骤6。 4.打开host2主机上的“/etc/ssh/sshdconfig”配置文件,查看另外节点是否配置在AllowUsers 、DenyUsers等白名单或者黑名单中。 是,执行步骤5。 否,联系OS专家处理。 5.修改白名单或者黑名单设置,保证omm用户在白名单中或者不在黑名单中。然后持续一段时间观察告警是否清除。 是,操作结束。 否,执行步骤6。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-12066 节点间互信失效
      • 节点干扰ContainerdSock检查
        本文主要介绍节点干扰ContainerdSock检查。 检查项内容 检查节点上是否存在干扰的Containerd.Sock文件。该文件影响euler操作系统下的容器运行时启动。 解决方案 问题场景:节点使用的docker为定制的Eulerdokcer而非社区的docker 步骤 1 登录相关节点。 步骤 2 执行rpm qa grep docker grep euleros命令,如果结果不为空,说明节点上使用的docker为Eulerdocker 步骤 3 执行ls /run/containerd/containerd.sock命令,若发现存在该文件则会导致docker启动失败。 步骤 4 执行rm rf /run/containerd/containerd.sock命令,然后重新进行集群升级检查。
        来自:
        帮助文档
        云容器引擎
        用户指南
        集群管理
        集群升级
        升级前检查
        节点干扰ContainerdSock检查
      • CTCCL-Slowdetect最佳实践
        本文为您介绍CTCCLSlowdetect最佳实践。 在4台A8008,每台节点有8张mlx网卡,RoCE组网,部署慢节点工具套件。其中,在4节点上容器化部署模型训练基础环境以及llama27b训练模型,在node1上容器化部署ctccm服务,并在每一台节点上容器化部署ctcclprofiler服务。 在训练任务代码中调用ctcclprofilercomm API: 在训练脚本中配置相关环境变量 启动ctccmslowdetect服务 export PATH"/usr/local/python3/bin:$PATH"(替换为自己的安装路径) && ctccm nnodes 4 port 8002 debug 启动所有节点上的ctcclprofilernet服务 启动分布式训练任务,ctccm会收到任务的逻辑拓扑 ctccm在训练中检测集群中是否存在慢节点,一旦发现慢节点则下发开始收集细粒度的监控信息的控制信号,并做慢节点定位定界。 当计算慢时,ctccm会给出计算慢的TP通信域所包含的rank。 当通信慢时,ctccm会给出慢的QP以及它所对应的网卡对和所在节点。
        来自:
        帮助文档
        训推服务
        用户指南
        训推加速
        慢节点检测工具套件 CTCCL-Slowdetect
        CTCCL-Slowdetect最佳实践
      • 终端节点
        本章节说明OpenAPI接入节点。 媒体存储提供原生接口以及OpenAPI两种接入方式,两者接入点以及服务区域有所不同,请参考一下信息接入。 说明 建议优先采用原生接口的方式接入。 接入方式 接入点 适用服务区域 原生接口 用户开通媒体存储服务以及资源池后,可通过资源池与区域节点 获取对应的区域节点信息。 全局 OpenAPI 西藏资源池1区
        来自:
        帮助文档
        媒体存储
        API参考
        调用前须知
        终端节点
      • API概览
        API标题 API概述 查询集群节点组详情 提供查询用户集群节点组详情功能,系统接收用户输入的查询条件,返回符合条件的集群节点组信息。 获取节点组信息 提供查询用户集群节点组信息功能,系统接收用户输入的查询条件,返回符合条件的集群节点组详细信息。
        来自:
        帮助文档
        翼MapReduce
        API参考
        API概览
      • 调度策略概述
        CCE支持“自定义调度策略”和“简易调度策略”。自定义调度策略开放节点亲和、工作负载亲和以及工作负载反亲和调度策略的配置,以满足用户的更高需求。简易调度策略提供简单便捷以及足够功能的调度方式。 自定义调度策略 在自定义调度策略中用户可以设置“节点亲和性”、“工作负载亲和性”和“工作负载反亲和性”,详情详见Affinity and antiaffinity。 节点亲和性 工作负载亲和性 工作负载反亲和性 说明: 亲和性调度中需要设置的标签依赖节点的标签和Pod的标签,用户可以使用内置的标签进行设置,或者可以根据需求自定义节点和Pod的标签并使用。 简易调度策略 简易调度策略提供工作负载和可用区的亲和性、工作负载和节点的亲和性以及工作负载间的亲和性调度,用户可根据业务需求进行相应的设置部署工作负载。 工作负载和可用区的亲和性:基于可用区可以设置多条调度策略(包含亲和、反亲和),但只需满足其中一条就会进行调度。 − 与可用区的亲和性:即工作负载和可用区的亲和性。 − 与可用区的反亲和性:即工作负载和可用区的反亲和性。 工作负载和节点的亲和性:基于节点可以设置多条调度策略(包含亲和、反亲和),但只需满足其中一条就会进行调度。例如集群下有节点A、B、C,设置调度策略为亲和节点A,反亲和节点B,则工作负载可以调度到除B以外任意一个节点上 − 与节点的亲和性:即工作负载和节点的亲和性。 − 与节点的反亲和性:即工作负载和节点的反亲和性。 工作负载间的亲和性:基于工作负载可以设置多条调度策略,但多条策略中设置的标签必须同时出现在一个工作负载中。 − 与工作负载的亲和性:即工作负载间的亲和性。用户可根据业务需求进行工作负载的就近部署,容器间通信就近路由,减少网络消耗。 如下图,Workload1、Workload2、Workload3和Workload4部署在相同节点上,为亲和性部署。 图工作负载间亲和 − 与工作负载的反亲和性:即工作负载间的反亲和性。同个工作负载的多个实例反亲和部署,减少宕机影响;互相干扰的工作负载反亲和部署,避免干扰。 如下图,Workload1、Workload2、Workload3和Workload4分别部署在不同节点上,这四个工作负载为反亲和性部署。 图工作负载间反亲和 须知: 在设置“工作负载间的亲和性”和“工作负载和节点的亲和性”时,需确保不要出现互斥情况,否则工作负载会部署失败。 例如如下互斥情况,工作负载将会部署失败: Workload1、Workload2设置了工作负载间的反亲和,例如Workload1部署在“节点A”,Workload2部署在“节点B”。 Workload3部署上线时,既希望与Workload2亲和,又希望可以部署在不同节点如“节点C”或“节点 A ” 上,这就造成了工作负载亲和节点亲和间的互斥,导致最终工作负载部署失败。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        亲和/反亲和性调度
        调度策略概述
      • 开启并配置MySQL数据库代理服务
        步骤三:配置MySQL数据库代理服务 1. 在天翼云官网首页的顶部菜单栏,选择产品 > 数据库 > 关系型数据库 > 关系数据库MySQL版 ,进入关系数据库MySQL产品页面。然后单击管理控制台 ,进入概览页面。 2. 在左侧导航栏,选择MySQL > 实例管理,进入实例列表页面。然后在顶部菜单栏,选择区域和项目。 3. 在实例列表中,单击目标实例名称,进入实例基本信息页面。 4. 单击数据库代理,进入数据库代理页面。 5. 在读写规则 选项下,单击设置。 6. 在对话框内,选择需要的选项进行设置。 注意 对于可以处理读写请求的主节点,如果主实例的主节点权重设置为0,则不会处理任何读写请求,将影响您的写入操作。 建议将主节点权重设置为非0值,其他备节点权重设置相对较大值以分担读请求。 当您新创建一个账号后,马上通过数据库代理使用新账号连接的时候,会提示拒接访问。是因为定时任务同步需要大约23分钟的时间导致的,请您23分钟后再尝试连接即可。 参数 说明 读写属性 设置读写方式。 读写(读写分离)(默认):同时连接主实例和只读实例(或备节点),可以接受写请求。 连接池 代理连接地址设置的连接池类型: 事务级连接池:适用于总连接数比较多(如连接数上万)的场景。 会话级连接池:适用于短连接场景。 延迟阈值 只读实例或备节点同步主实例数据时允许的最长延迟时间。若一个节点的延迟时间超过该阈值,读请求不会转发至该节点。范围为03600s。 延迟检查间隔 检查主从延迟的时间间隔,即每多少秒检查一次主从延迟,如果超过延迟阈值,则不转发读请求。范围为13600s。 容错次数 检查主从时间延迟,连续检查设置的次数后,如每次都超过延迟阈值,则确认该节点已延迟,不转发读请求。 事务拆分 是否开启事务拆分功能。事务拆分能够将事务内的读请求转发到只读实例或者备节点,降低主实例负载。 默认为关闭 。 前端连接数 前端连接数是指应用程序到数据库代理的连接数量,需根据业务并发需求合理设置。 后端连接数 在自定义分配中,可以自定义每个节点的后端连接数。后端连接数指数据库代理与数据库实例节点之间的连接数量,需确保其不超过数据库节点设定的最大连接数上限,请根据业务合理配置。 读写分离权重分配 实例的读权重越高,处理的读请求越多。例如,假设实例有1个主节点和3个备节点(包含只读实例),读权重分别为100、100、200和200,则表示主节点、3个备节点按照1:1:2:2的比例处理读请求。 系统分配:系统根据实例规格自动分配各个节点的读权重。后续该主节点下新增的只读节点不会自动设置权重,需要手动重新配置加入到读写分离链路中。更多信息请参见系统权重分配规则。 自定义:手动设置各个节点的读权重,权重输入范围为0100000,且必须是整数。后续该主节点下新增只读节点的读权重默认为0,需要您手动配置。 说明 分配权重展示的是主节点和备节点(包含只读实例),例如:一主两备实例,则展示三个节点,用于配置权重。 7. 单击确定,等待配置生效。 说明 开启数据库代理后,若进行了系列升级、迁移可用区等导致实例的节点信息发生变更的操作,则需要在数据库代理页面重新设置节点权重,以刷新后端的节点信息。
        来自:
        帮助文档
        关系数据库MySQL版
        用户指南
        数据库代理
        开启并配置MySQL数据库代理服务
      • 堡垒机v1.0
        堡垒机的部署对网络有什么样的要求? 堡垒机要求与被运维终端网络可达。 堡垒机支持双因素身份认证吗? 支持双因素认证,如: 自带免费的手机APP动态口令认证。 可与短信网关平台对接,实现短信口令认证。 堡垒机能对数据库程序进行审计吗? 支持对主流数据库(如Oracle、MySQL、Sql Server、DB2)的运维审计。 堡垒机能对文件传输进行审计吗? 文件传输方式很多(如SFTP、FTP、RDP、RZ、SZ),堡垒机可以备份这些协议传输过的文件,便于事后定位追踪,同时堡垒机还能对重要的服务器控制文件传输,防止数据失泄密。 可以使用MacOS或Linux系统电脑访问堡垒机再访问服务器吗? 支持,直接利用C/S运维方式,H5运维即可。 堡垒机是否支持API接口供其它平台调用? 堡垒机提供开放的API接口,允许第三方平台调用堡垒机的用户数据、主机数据、授权数据、审计数据。
        来自:
        帮助文档
        云等保专区
        常见问题
        产品配置类
        堡垒机
        堡垒机v1.0
      • 网站漏洞
        网站漏洞扫描主要是针对WEB应用的SQL注入、跨站、远程挂马、跨站请求伪造 CSRF、OWASP top 10 等漏洞进行扫描进行网站漏洞扫描,实时将数据反馈到安全专区,进行动态展示。 操作方法 1.网站漏洞数据来源:点击【资产管理】→【域名】,扫描后,如果该网站有漏洞则会同步到【网站漏洞】模块。 2.选择时间范围内,进行趋势分析。 风险终端 可以实时分析、日志追溯等方式进行数据查找和分析,记录站点来源信息以及网站网页信息类型,记录网站漏洞名称、漏洞等级、漏洞发现时间、漏洞处理状态及漏洞具体描述。 点击【导出】,即下载网站漏洞扫描报告。 点击【漏洞描述】即展示网站漏洞具体域名地址、网站漏洞详情。
        来自:
        帮助文档
        安全专区
        用户指南
        风险分析
        网站漏洞
      • 集群管理类
        MRS集群节点时间信息不正确如何处理? 若集群内节点时间不正确,请分别登录集群内时间不正确的节点,并从步骤2开始执行。 若集群内节点与集群外节点时间不同步,请登录集群外节点,并从步骤1开始执行。 1.执行vi /etc/ntp.conf 命令编辑NTP客户端配置文件,并增加MRS集群中Master节点的IP并注释掉其他server的地址。 server master1ip prefer server master2ip 增加Master节点的IP 2.执行service ntpd stop命令关闭NTP服务。 3.执行 /usr/sbin/ntpdate 主Master节点的IP地址 命令手动同步一次时间。 4.执行service ntpd start 或systemctl restart ntpd命令启动NTP服务。 5.执行ntpstat命令查看时间同步结果。 如何查询MRS节点的启动时间? 登录当前节点,执行如下命令查询节点启动时间: date d "$(awk F. '{print $1}' /proc/uptime) second ago" +"%Y%m%d %H:%M:%S" 节点互信异常如何处理? 当Manager报“ALM12066 节点间互信失效”告警,或者发现节点间无ssh互信时,可参考如下步骤操作。 1. 分别在互信集群的两端节点执行sshadd l确认是否有identities信息。 2. 如果没有identities信息,执行ps efgrep sshagent 找到sshagent 进程,并kill该进程等待该进程自动重启。 3. 执行sshadd l 查看是否已经添加identities信息,如果已经添加,请手动ssh确认互信是否正常。 4. 如果有identities信息,需要确认/home/omm/.ssh/authorizedkeys中是否有对端节点/home/omm/.ssh/idrsa.pub文件中的信息,如果没有手动添加对端节点信息。 5. 检查/home/omm/.ssh目录下的文件权限是否正确。 6. 排查日志文件 “/var/log/Bigdata/nodeagent/scriptlog/sshagentmonitor.log”。 7. 如果用户把omm的家目录删除了,需要联系MRS支撑人员修复。
        来自:
        帮助文档
        翼MapReduce
        常见问题
        操作类
        集群管理类
      • 删除集群
        当您无需集群提供服务时,您可删除该集群以免产生额外的费用,本文介绍了如何通过弹性高性能计算控制台删除集群。 前提条件 确保已备份好集群的所有数据。 约束与限制 删除集群前需释放所有节点,系统将自动完成集群删除。 操作步骤 1.进入弹性高性能计算控制台。 2.在左侧导航栏,选择“节点”。 3.在节点列表中点击要删除的节点,后侧操作进行删除。 计费方式的不同释放节点方式不同,按量付费的节点将立即释放,而包年包月的节点会退订后释放。 4.待全部节点释放后,该集群会自动删除。
        来自:
        帮助文档
        弹性高性能计算 E-HPC
        用户指南
        管理集群
        删除集群
      • 配置负载容忍策略
        本节介绍了 配置负载容忍策略的用户指南。 调度器能够借助容忍度(Toleration)机制,将Pod部署到带有相应污点的节点之上。这一机制的实现依赖于容忍度与节点污点的协同作用。节点可配置一个或多个污点,对于缺乏对应容忍度的Pod,调度器会根据污点的具体效果进行筛选,以避免不恰当的节点分配。更多关于容忍度的应用实例,请参阅K8S官网“污点与容忍度”章节。 不同类型的污点效果 NoExecute 已在该节点运行的Pod会立即被移除。 未运行的Pod则不会被调度至此节点。 若未设定容忍时间(tolerationSeconds),Pod可持续在该节点运行。 若设定了容忍时间,Pod将在指定时间内继续运行,超时后则被移除。 PreferNoSchedule 已运行的Pod不受影响,不会被移除。 未运行的Pod尽量避免调度至此节点。 Pod可长期在该节点上运行。 NoSchedule 已运行的Pod同样不受影响。 未运行的Pod不会被调度至此节点。 Pod能持续在该节点上运行。 容忍策略配置参数详解 参数名称 参数说明 污点键 标识节点的污点键。 操作符 Equal:精确匹配指定污点键(必填)及值的节点;Exists:匹配存在指定污点键的节点,此时无需指定污点值。 污点值 当操作符为Equal时,需填写对应的污点值。 污点效果 全部:匹配所有污点效果;NoSchedule、PreferNoSchedule、NoExecute:分别匹配对应的污点效果。 容忍时间 即tolerationSeconds,仅NoExecute效果时支持配置,设定Pod在污点节点上的容忍时长,超时后被移除。
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        用户指南
        工作负载(新版)
        配置负载容忍策略
      • 产品定义
        本节介绍了什么是云容器引擎,便于用户对容器产品有个总体认识。 云容器引擎提供高度可扩展的、高性能的Kubernetes集群、一站式容器服务;获得信通院可信云《全栈容器云解决方案》认证,兼容主流国产化服务器和操作系统,取得全栈国产化适配认证证书。其整合了镜像、监控、日志、负载均衡、灰度/蓝绿、多种弹性策略、高效调度、集群插件、模板市场等基础能力,帮助企业快速构建和运行可弹性扩展的应用,实现业务的快速交付与持续创新。 产品形态 云容器引擎包含了专有版集群和托管版集群两种产品形态。 比较项 专有版集群 托管版集群 比较项 专有版集群 单实例 高可用 特点 自行创建控制节点(Master节点)以及工作节点(Worker节点) 只需创建工作节点(Worker节点),控制节点(Master节点)由云容器引擎创建并托管,您无需管理控制节点 计费项 集群管理、控制节点、工作节点以及其他IaaS云资源 集群管理、工作节点以及其他IaaS云资源 应用场景 适用于所有场景,您可以对集群基础设施进行更细粒度的控制,需要自行规划、维护、升级服务器集群 适用于个人学习体验 适用于对性能、可用性和安全性有更高要求的企业级用户 用户画像 有Kubernetes开发运维背景,懂Kubernetes 对控制节点(Master节点)有定制化需求 有明确的集群资源规划,完全自管集群 Kubernetes新手,用于个人学习体验 个人开发与测试 减少对Kubernetes的运维投入以及成本投入 不关心控制节点(Master),只关注业务应用 企业生产系统部署
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        产品介绍
        产品定义
      • 节点分布
        本文介绍天翼云AOne边缘安全加速平台的节点分布情况。 天翼云CDN,在中国内地拥有2000+节点,覆盖多运营商和31个省份区域,大量节点位于省会及一二线主要城市;在海外、中国香港、中国澳门和中国台湾拥有800+节点,遍布亚洲、美洲、欧洲、非洲等大洲主要国家和城市。全网业务承载能力达160Tbps。 全球节点具体分布如下: 计费区域 节点分布 中国内地 东北地区:黑龙江、吉林、辽宁。 华北地区:北京、天津、河北、河南、山东、山西、内蒙古。 华东地区:上海、浙江、江苏、江西、安徽。 华中地区:湖北、湖南。 华南地区:广东、广西、海南、福建。 西南地区:四川、云南、贵州、西藏、重庆。 西北地区:甘肃、宁夏、陕西、青海、新疆。 全球(非中国内地) 亚洲:日本、香港、新加坡、马来西亚、泰国、印度尼西亚、越南、阿联酋。 北美洲:美国。 南美洲:巴西。 大洋洲:澳大利亚。 欧洲:德国、法国、英国、荷兰。 非洲:南非。
        来自:
        帮助文档
        边缘安全加速平台
        产品介绍
        节点分布
      • 变更集群实例的CPU和内存规格
        本页介绍了变更集群实例的CPU和内存规格。 文档数据库服务产品的集群规格实例,支持Shard节点和Mongos节点进行规格变更。 Shard节点规格变更 集群规格实例的Shard节点规格扩容步骤如下: 1. 进入TeleDB数据库控制台。 2. 点击“DDS”>“实例管理”进入实例列表页面。 3. 在需要进行Shard规格变更集群实例的“操作”列,点击“更多”,可见“Shard规格变更”。 4. 点击“Shard规格变更”,自动进入到Shard规格变更页面。 5. 在规格变更页面,根据指引,选择合适的Shard节点规格进行规格变更,点击“提交”。 6. 支付完成后,等待数分钟,刷新该实例的详细信息,在实例节点栏可见Shard节点的规格已完成变更。 Mongos节点规格扩容 集群规格实例的Mongos节点规格扩容步骤如下: 1. 进入TeleDB数据库控制台。 2. 点击“DDS”>“实例管理”进入实例列表页面。 3. 在需要进行Mongos规格变更集群实例的“操作”列,点击“更多”,可见“Mongos规格变更”。 4. 点击“Mongos规格变更”,自动进入到Mongos规格变更页面。 5. 在规格变更页面,根据指引,选择合适的Mongos节点规格进行规格变更,点击“提交”。 6. 支付完成后,等待数分钟,刷新该实例的详细信息,在实例节点栏可见Mongos节点的规格已变更。
        来自:
        帮助文档
        文档数据库服务
        用户指南
        实例变更
        实例规格变更
        变更集群实例的CPU和内存规格
      • 主备复制类问题
        本页介绍天翼云TeleDB数据库主备复制类问题。 xlog(WAL)日志被清理问题 问题描述 在添加备节点、重做备机,或在日常运行中,可能遇到备节点报错 FATAL,XX000,"could not receive data from WAL stream: ERROR: requested WAL segment000000010000000600000054 has already been removed 可能影响 添加备节点失败; 重做备机失败; 主备复制不同步,导致备机不可用; 解决步骤 通常出现在WAL日志文件增长较快,且DN节点数据量较大,添加备机或重做备机需要较长时间的场景,针对此场景,可以有以下应对策略: 1. DN节点数据量较大,应控制好单节点DN数据量,大小建议不超过510T,同时要确保有较好的磁盘性能,整体添加备节点、重做备机时间控制在12小时内存完成; a、如果单DN容量超过了建值,则应该通过横向扩容方式,将DN数据分布到更多服务器; b、如果因磁盘性能不足,导致整个任务时间过长,则建议节点在横向扩容的基础上,优化磁盘I/O,或更换性能更好的磁盘; 2. 选择在业务低峰期添加备节点、重做备机,此时产生的WAL日志速度较慢,可以保证主节点默认保留的WAL日志文件在任务完成前不被清理; 3. 调大参数walkeepsegments,该参数用于指定pgwal目录中保存的过去的WAL日志文件的最小数量,避免因主节点保留文件数量不够,导致在添加备节点、重做备机任务执行期间被自动清理;默认WAL日志文件大小为16MB,需要提前预估日志文件占用空间,避免磁盘空间不足问题。 4. 主备节点不同步,延迟过大也可能导致主节点日志在同步到备机前被清理 a、可能是备节点服务器性能较差,主节点业务高峰期时,备节点WAL日志接收延迟 解决办法:应确保主备节点服务器配置一致,避免因配置不对等导致的性能问题,以及可能出现的发生主备切换后,新的主节点性能不足,影响业务的问题; b、可能是网络异常或主节点上有大事务,生成大量WAL日志,导致同步延迟 解决办法:应该确保网络稳定;避免大事务,应拆分成多个小事务执行。
        来自:
        帮助文档
        分布式融合数据库HTAP
        私有云产品
        故障处理
        主备复制类问题
      • 服务器列表
        项目 描述 服务器ID 服务器ID。 服务器ID后带(M)表示为主服务器。 服务器ID后带()表示为基础节点服务器。 如果只有服务器ID,则属于非基础节点服务器。 服务器名称 服务器名称。 节点名称 节点在集群中的全路径名称(仅集群版支持),从根节点开始,使用 name:name:name 格式来唯一标识该节点的名称。 父节点名称 该服务器的父节点名称(仅集群版支持)。 状态 服务器状态: 已连接。 未连接。 移除中。 数据目录容量 数据目录已用容量以及总容量。 业务IP:端口 业务网的IP和端口号。 集群IP 集群网的IP。 服务启动时间 HBlock服务在该节点上最近一次成功启动的时间。 :表示HBlock服务处于停止状态。
        来自:
        帮助文档
        存储资源盘活系统
        用户指南
        服务器
        服务器列表
      • 仪表盘
        防护节点在线数量 页面右侧展示了防护节点的在线数量及在线率,并统计了节点总数、在线节点、离线节点以及已防护节点的数量。 镜像漏洞 仪表盘页面底部,展示了近10天内的镜像漏洞数量和存在漏洞的容器数量的变化趋势图,帮助您了解资产安全状态和存在的隐患。
        来自:
        帮助文档
        容器安全卫士
        用户指南
        仪表盘
      • 重启实例
        本文介绍如何根据实际需求重启天翼云云搜索服务的Elasticsearch实例或节点。 实例出现异常,或您有其他需要时,可以通过控制台重启实例尝试恢复运行,有实例重启与角色重启、单节点重启三种方式,建议在业务空闲时进行重启操作。 前提条件 实例处于运行中或异常状态,未处于其他操作引起的重启中,未被冻结。 注意 当实例处于运行中时,确认已停止数据写入、检索操作,否则重启实例可能会带此时写入的数据丢失、搜索不到数据等情况。 实例重启同时全量节点重启,耗时短,实例全程不可用;滚动重启仅重启节点不可用,但节点较多时重启耗时比较久。 使用限制 实例滚动重启、按角色重启、按节点重启仅限云搜索1.2.0版本及以上实例使用。 操作步骤 1. 登录云搜索服务管理控制台,在左侧导航栏,选择对应的实例类型,进入管理列表界面。 2. 在对应实例的“操作”列中单击“更多>重启”。 3. 在重启选项中根据需要选择: 选项 说明 实例重启 全量重启:实例全部节点重启,重启过程实例暂不可 用 滚动重启:滚动重启会一个一个重启节点,在索引数量比较多的情况下耗时较长 角色重启 可以根据实例角色(如master节点、协调节点等)单选或多选重启范围,角色重启也支持全量/滚动重启 节点重启 可以单选实例中的某一个节点进行重启,节点重启仅可单选, Kibana或Cerebro节点重启请在此选择 4. 重启实例后,请刷新页面,观察状态。重启过程中,实例状态为“处理中(重启)”,如果实例状态变更为“运行中”,表示实例已重启成功。
        来自:
        帮助文档
        云搜索服务
        用户指南
        Elasticsearch实例创建及使用
        管理实例
        重启实例
      • 设置容器规格
        操作场景 CCE支持在创建工作负载时为添加的容器设置资源限制。可以对工作负载中每个实例所用的CPU配额、内存配额进行申请和限制。 配置含义 在CPU配额和内存配额设置中,申请 与限制的含义如下: 勾选“申请”表示启动该配置,系统根据申请值调度该实例到满足条件的节点去部署工作负载。 不勾选“申请”表示系统调度实例到随机的一个节点去部署工作负载。 勾选“限制”表示启动该配置,根据设定的值,限制工作负载使用的资源。 不勾选“限制”表示实例使用的资源不做限制,但若实例使用的内存资源超过节点可分配内存时,可能会导致工作负载不可用或者节点不可用。 说明: 创建工作负载时,建议设置CPU和内存的资源上下限。同一个节点上部署的工作负载,对于未设置资源上下限的工作负载,如果其异常资源泄露会导致其它工作负载分配不到资源而异常。未设置资源上下限的工作负载,工作负载监控信息也会不准确。 在GPU配额设置中,使用 与不限制的含义如下: 勾选“使用”表示启动该配置,系统根据设定的值调度该实例到满足条件的节点去部署工作负载。 “不限制”默认选中,不可取消。表示该项对实例使用的资源不做限制。 配置说明 CPU配额: 参数 说明 CPU申请 容器使用的最小CPU需求,作为容器调度时资源分配的判断依赖。只有当节点上可分配CPU总量 ≥ 容器CPU申请数时,才允许将容器调度到该节点。 CPU限制 容器能使用的CPU最大值。 建议配置方法: 节点的实际可用分配CPU量 ≥ 当前实例所有容器CPU限制值之和 ≥ 当前实例所有容器CPU申请值之和,节点的实际可用分配CPU量请在“资源管理 > 节点管理”中对应节点的“可分配资源”列下查看“CPU: Core”。 内存配额: 参数 说明 内存申请 容器使用的最小内存需求,作为容器调度时资源分配的判断依赖。只有当节点上可分配内存总量 ≥ 容器内存申请数时,才允许将容器调度到该节点。 内存限制 容器能使用的内存最大值。当内存使用率超出设置的内存限制值时,该实例可能会被重启进而影响工作负载的正常使用。 建议配置方法: 节点的实际可用分配内存量 ≥ 当前节点所有容器内存限制值之和 ≥ 当前节点所有容器内存申请值之和,节点的实际可用分配内存量请在“资源管理 > 节点管理”中对应节点的“可分配资源”列下查看“内存: GiB”。 说明: 可分配资源:可分配量按照实例请求值(request)计算,表示实例在该节点上可请求的资源上限,不代表节点实际可用资源。 计算公式为: 可分配CPU CPU总量 所有实例的CPU请求值 其他资源CPU预留值 可分配内存 内存总量 所有实例的内存请求值 其他资源内存预留值 使用示例 以集群包含一个资源为4Core 8GB的节点为例,已经部署一个包含两个实例的工作负载到该集群上,并设置两个实例(实例1,实例2)的资源为{CPU申请,CPU限制,内存申请,内存限制}{1Core,2Core,2GB,2GB}。 那么节点上CPU和内存的资源使用情况如下: 节点CPU可分配量4Core(实例1申请的1Core+实例2申请的1Core)2Core 节点内存可分配量8GB(实例1申请的2GB+实例2申请的2GB)4GB 因此节点还剩余2Core 4GB的资源可供下一个新增的实例使用。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        工作负载
        容器设置
        设置容器规格
      • 1
      • ...
      • 74
      • 75
      • 76
      • 77
      • 78
      • ...
      • 230
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      天翼云新春焕新季

      云主机开年特惠28.8元/年,0元秒杀等你来抢!

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      多活容灾服务

      GPU云主机

      镜像服务 IMS

      轻量型云主机

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      训推服务

      公共算力服务

      模型推理服务

      推荐文档

      监控节点运行状态

      策略管理

      云课堂 第十四课:天翼云云硬盘的磁盘模式及共享盘

      扶持政策

      关机

      修改云安备用户信息

      卸载

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号