活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 聚力AI赋能 天翼云大模型专项 大模型特惠专区·Token Plan 轻享包低至9.9元起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 企业出海解决方案 NEW 助力您的业务扬帆出海,通达全球!
  • 天翼云信创专区 NEW “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
Token服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V4-Flash
  • GLM-5.1
  • Qwen3.5-122B-A10B
  • DeepSeek-V3.2(旗舰版)
  • GLM-5(正式版)
智算一体机
  • 智算一体机
智能体引擎
  • 智能体引擎
智算安全专区
  • 大模型安全评测
  • 大模型安全护栏
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2026智能云生态大会
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      电信云日志审计_相关内容
      • 云主机网络包损坏
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察应用,特别是那些进行大文件传输或对实时性要求高的服务,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机网络包损坏
      • 云容器集群节点网络包损坏
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点网络包损坏
      • 云容器集群Pod网络包损坏(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
      • 云容器集群节点网络包损坏(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
      • 云主机网络包损坏(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察应用,特别是那些进行大文件传输或对实时性要求高的服务,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
      • 云主机端口占用(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到端口占用动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务请求量、应用提供服务平均响应时间指标。 2、业务应用验证: 尝试启动原本需要使用该端口的业务服务。预期服务启动会失败,并在其日志或控制台输出中看到明确的错误信息,如 Address already in use 或 端口已被占用。
        来自:
      • 云主机网络延迟(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络延迟动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证: 观察应用,确认依赖网络通信的模块(如调用外部API、数据库查询)是否出现响应缓慢或请求超时。 检查应用日志,确认是否有因超时而触发的重试、熔断或降级逻辑。
        来自:
      • 查看实例详情
        本页介绍天翼云TeleDB数据库如何查看实例详情。 实例详情页面向我们展示了目标实例的基本信息、高可用管理和定时任务。 基本信息:包括实例信息、GTM节点信息、协调节点信息和数据节点信息。 高可用管理:您可参考《高可用管理》章节。 定时任务:您可参考《定时任务》章节。 操作步骤 1. 以用户名和密码登录分布式数据库 控制台。 2. 在左侧导航树中,单击实例列表 ,进入实例列表页面。 3. 您可通过以下两种方式查看实例详情页面。 在实例列表页面,单击目标实例的实例名称 可跳转至实例详情页面。 在实例列表页面,单击目标实例所在行的详情 可进入实例详情页面。 4. 在实例详请页面,您可查看实例基本信息。 实例信息:实例ID、实例名称、字符集和创建日期。 GTM节点信息:规格、节点名称/IP/端口、角色、同步类型、日志同步状态、状态、操作状态、更新时间、版本号和操作。 数据节点信息:规格、节点名称/IP/端口、角色、同步类型、日志同步状态、状态、回放延迟、操作状态、更新时间、版本号和操作。 协调节点信息:规格、节点名称/IP/端口、角色、同步类型、日志同步状态、状态、操作状态、更新时间、版本号和操作。 数据库实例状态 数据库实例状态是数据库实例的运行情况。用户可以使用管理控制台和API操作查看数据库实例状态。 状态 说明 运行中 数据库实例正常运行。 停止 数据库实例已停止。 已退订 数据库实例已退订。 恢复中 正在恢复备份到数据库实例中。 恢复失败 数据库实例恢复失败。 启动失败 数据库实例启动失败。 停止失败 数据库实例停止失败。 创建中 正在创建数据库实例。
        来自:
        帮助文档
        分布式融合数据库HTAP
        私有云产品历史版本
        V3.0.0版本产品文档
        管理平台使用手册
        维护管理实例
        查看实例详情
      • 升级HBlock
        本节主要介绍如何使用API升级HBlock。 此操作用来升级HBlock。 说明 可以通过查询升级进度接口查询升级服务是否完成。 免费版仅支持2年内升级。 注意 升级期间建议仅执行查询操作,避免其他操作,以免引起服务异常。 升级过程中系统会做检查,如果不符合升级条件,可能会导致升级失败,升级失败的原因可以在执行升级操作的服务器上查看日志upgrade.log(日志路径:HBlock安装目录/logs/ops/upgrade.log)。建议升级之前对系统进行检查,确保: 所有状态正常: 所有HBlock服务器连接正常,没有处于删除状态的服务器。 HBlock处于working、upgrading状态。 如果软件许可证是订阅模式,需在有效期内;如果软件许可证是永久许可模式,需在维保期限内;如果处于试用期,需试用期未结束。 集群版:如果卷是高可用类型,至少保证卷的主备连接正常。 没有处于失败或者任务进行中状态的卷。 系统整体数据冗余度不降级,正常数据百分比为100%。并且,可用故障域数量和健康数量大于所有卷的写入需求。 升级监听服务(stor:ua)正常。 协议解析服务(stor:ps)正常。 集群版:数据服务(stor:dsx)正常。 集群版:基础服务正常:元数据管理服务(stor:mdm)、日志服务(stor:ls)、协调服务(stor:cs)。 注意 执行升级HBlock前,确保每个服务器的HBlock安装路径对应的文件系统,存在至少1 GiB的可用空间。 如果集群由不同架构服务器组成,请添加所有架构的升级文件,并保持版本一致。
        来自:
        帮助文档
        存储资源盘活系统
        API参考
        升级HBlock
        升级HBlock
      • ALM-14011 DataNode数据目录配置不合理
        检查DataNode数据目录是否与系统关键目录使用同一磁盘 17.分别使用df命令获取DataNode数据目录中的每个目录的磁盘挂载情况。 18.查看命令结果的磁盘挂载目录是否为系统关键目录(“/”或“/boot”)。 是,执行步骤19。 否,执行步骤24。 19.修改该DataNode节点的配置参数“dfs.datanode.data.dir”的值,删除与系统关键目录使用同一磁盘的目录。 20.继续执行步骤24。 检查DataNode数据目录中是否多个目录使用同一磁盘 21.分别使用df命令获取DataNode数据目录中每个目录的磁盘挂载情况。记录命令结果的磁盘挂载目录。 22.修改该DataNode节点的配置参数“dfs.datanode.data.dir”的值,对于其中磁盘挂载目录相同的DataNode目录,仅保留其中的一个目录,删除其他目录。 23.继续执行步骤24。 重启DataNode,检查告警是否消除 23.在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > HDFS > 实例”,重启该DataNode实例。 24.检查该告警是否恢复。 是,处理完毕。 否,执行步骤26。 收集故障信息 25.在FusionInsight Manager首页,选择“运维 > 日志 > 下载”。 26.在“服务”中勾选待操作集群的“HDFS”。 27.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 28.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-14011 DataNode数据目录配置不合理
      • ALM-12010 Manager主备节点间心跳中断
        检查节点名配置是否正确 6.进入软件安装目录。 cd /opt 7.查找主备节点的配置文件目录。 find name hacomlocal.xml 8.进入workspace目录。 cd ${BIGDATAHOME}/omserver/OMS/workspace0/ha/local/hacom/conf/ 9.使用vim命令打开hacomlocal.xml,查看local、peer节点配置是否正确,local配置主节点,peer配置备节点。 是,执行步骤12。 否,执行步骤10。 10.修改hacomlocal.xml中主备节点的配置,修改完成后,按Esc回到命令模式,输入命令:wq保存退出。 11.查看此告警信息是否自动清除。 是,处理完毕。 否,执行步骤12。 检查是否防火墙禁用端口 12.执行命令lsof i :20012查询主备节点的心跳端口是否打开,有查询结果说明端口已经开放,否则说明端口被防火墙禁用。 是,执行步骤13。 否,执行步骤16。 13.执行命令iptables P INPUT ACCEPT,防止与服务器断开。 14.清除防火墙。 iptables F 15.查看告警列表中,该告警是否已清除。 是,处理完毕。 否,执行步骤16。 收集故障信息 16. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 17. 在“服务”中勾选如下节点信息,单击“确定”。 OmmServer Controller NodeAgent 18. 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 19. 请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-12010 Manager主备节点间心跳中断
      • 迁移或同步失败
        本章介绍主机迁移服务迁移或同步失败常见问题。 迁移中源端有新增的数据如何处理? 启动目的端后,若源端有新增的数据,单击此服务器所在行的操作列的“同步”,开始下一次复制(增量数据),当迁移状态为“持续同步”时,单击“启动目的端”,迁移实时状态为“已完成”时,说明新增数据已同步到目的端。 “迁移模块异常中止,无法同步”怎么处理? 问题描述 持续同步过程中出现“SMS.1414 迁移模块异常中止,无法同步”。 问题原因 迁移模块异常终止可能是因为用户手动重启过Agent或者源端服务器被重启过。 源端有一个监控磁盘变化的进程,用于将源端变化的部分同步到目的端。重启之后该进程被终止,会导致无法正确的将源端服务器的变化同步到目的端。 解决方案 该场景下无法继续完成迁移任务,请删除该任务后,重新迁移。请注意迁移过程中不要重启源端服务器或Agent。 Windows迁移过程中,源端SMSAgent突然退出,导致与主机迁移控制台断开连接 问题描述 Windows服务器迁移过程中,源端突然与SMS控制台断开连接,查看源端发现是迁移用的SMSAgent程序退出。 问题分析 出现该问题,可能是因为源端服务器“客户体验改善计划”导致SMSAgent程序退出。 1. 查看SMSAgent迁移日志中断时间。(C:SMSAgentPy3SmsAgentInfo.log) 2. 在源端服务器,打开计算机管理。选择“事件查看器>Windows 日志>系统”。 3. 在系统日志中,查看与SMSAgent迁移日志中断时间对应的系统日志。发现是因为一条客户体验改善计划的用户登录通知,导致源端服务器自动重启。 解决方案 关闭“客户体验改善计划”。 1. 在源端服务器,打开运行窗口,输入:gpedit.msc,单击“确定”,打开“组编辑策略器”。 2. 在导航栏,选择“计算机配置>管理模板>系统>Internet通信管理>Internet 通信设置”,找到“关闭Windows 客户体验改善计划”。 3. 双击“关闭Windows 客户体验改善计划”,打开编辑窗口,选择“已启用”,单击“确定”。 4. 打开计算机管理,选择“系统工具>任务计划程序库>Microsoft>Windows>Customer Experience Improvement Program”,禁用所有任务。 5. 选择“系统工具>任务计划程序库>Microsoft>Windows>Application Experience”,禁用所有任务。 6. 禁用客户体验改善计划相关任务后,需要在SMS控制台删除迁移任务,重新创建并启动迁移任务。
        来自:
        帮助文档
        主机迁移服务SMS
        常见问题
        迁移或同步失败
      • 因Xid错误导致的问题
        问题描述 用户在健康检查脚本或执行以下命令(dmesg grep i xid)中发现存在Xid报错,可以参考NVIDIA的Xid描述文档自行解决:NVIDIA Xid错误问题指引。 可能原因 Xid 说明 13 通常是数组越界、指令错误,小概率是硬件问题。 31 通常是应用程序的非法地址访问,极小概率是驱动或者硬件问题。 43 通常是您应用自身错误,而非硬件问题。 45 通常是您手动退出或者其他故障(硬件、资源限制等)导致的GPU应用退出,XID 45只提供一个结果,具体原因通常需要进一步分析日志。 68 通常是硬件或驱动问题。 解决方法 1. 尝试重新运行业务,观察Xid错误是否仍然存在。 2. 如果错误依然存在,请检查代码或分析日志,以确认是否由程序引起的Xid故障。 3. 如确认错误并非由程序引起,请联系技术支持以寻求解决方案。
        来自:
        帮助文档
        GPU云主机
        故障修复
        因Xid错误导致的问题
      • Flink SQL作业相关问题
        问题现象 在DLI上提交Flink SQL作业,作业运行失败,在作业日志中有如下报错信息: connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null 问题根因 该Flink SQL作业在配置作业运行参数时,有选择保存作业日志或开启Checkpoint,配置了OBS桶保存作业日志和Checkpoint。但是运行该Flink SQL作业的IAM用户没有OBS写入权限导致该问题。 解决方案 1.登录IAM控制台页面,单击“用户”,在搜索框中选择“用户名”,输入运行作业的IAM用户名。 2.单击查询到用户名,查看该用户对应的用户组。 3.单击“用户组”,输入查询到的用户组查询,单击用户组名称,在“授权记录”中查看当前用户的权限。 4.确认当前用户所属用户组下的权限是否包含OBS写入的权限,比如“OBS OperateAccess”。如果没有OBS写入权限,则给对应的用户组进行授权。 5.授权完成后,等待5到10分钟等待权限生效。再次运行失败的Flink SQL作业,查看作业运行状态。 Flink SQL作业读取DIS数据报Not authorized错误 问题现象 Flink SQL作业读取DIS数据,运行该作业时,语义校验失败。具体作业失败提示信息如下: Get dis channel xxx info failed. error info: Not authorized, please click the overview page to do the authorize action 问题原因 运行Flink作业前,没有对运行的用户账号授权获取DIS数据的权限。 解决方案 1.登录到DLI管理控制台,左侧导航栏选择“全局配置 > 服务授权”。 2.在服务授权管理界面,勾选“DIS Administrator”权限,单击“更新委托授权”完成对当前用户的DIS权限授权。 3.在“作业管理 > Flink作业”,单击对应的Flink SQL作业,重新启动和运行该作业。 Flink SQL作业消费Kafka后sink到es集群,作业执行成功,但未写入数据
        来自:
        帮助文档
        数据湖探索
        常见问题
        操作类
        Flink作业相关问题
        Flink SQL作业相关问题
      • ALM-12050 网络写吞吐率超过阈值
        检查阈值设置是否合理 1.在FusionInsight Manager,选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 > 网络写信息 > 写吞吐率”,查看该告警阈值是否合理(默认80%为合理值,用户可以根据自己的实际需求调节)。 是,执行步骤4。 否,执行步骤2。 2.根据实际服务的使用情况在“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 > 网络写信息 > 写吞吐率”,单击“操作”列的“修改”更改告警阈值。 如下图所示: 3.等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤4。 检查网口速率是否满足需求 4.打开FusionInsight Manager页面,在实时告警列表中,单击此告警所在行的,获取告警所在主机地址及网口。 5.以root用户登录告警所在主机。 6.执行命令ethtool 网口名称 ,查看当前网口速率最大值Speed。 说明 对于虚拟机环境,通过命令可能无法查询到网口速率,建议直接联系系统管理确认网口速率是否满足需求。 7.若网络写吞吐率超过阈值,直接联系系统管理员,提升网口速率。 8.检查该告警是否恢复。 是,处理完毕。 否,执行步骤9。 收集故障信息 9.在主集群的FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 10.在“服务”中勾选“OMS”,单击“确定”。 11.设置“主机”为告警所在节点和主OMS节点。 12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。 13.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-12050 网络写吞吐率超过阈值
      • ALM-14025 租户文件对象使用率超过阈值
        处理步骤 查看阈值设置是否合理 1.查看告警定位信息,获取上报告警的租户名称,租户目录。 2.在FusiongInsight Manager首页,单击“租户资源”页面选择上报告警的租户名称,单击“资源”,查看上报告警的租户目录所对应的文件数阈值配置设置是否合理(默认90%为合理值,用户可以根据自己的实际需求调节)。 是,执行步骤5。 否,执行步骤3。 3.根据该租户该目录文件数的实际使用情况,在“资源”页面单击“修改”修改或取消上报告警的租户目录所对应的文件数阈值配置。 4.等待1分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤5。 查看租户分配的文件对象数是否合理 5.在FusionInsight Manager首页,在“租户资源”页面选择上报告警的租户名称,单击“资源”,查看上报告警的租户目录所对应的文件目录数上限设置是否合理(根据该租户该目录实际业务情况而定)。 是,执行步骤8。 否,执行步骤6。 6.根据租户该目录的实际业务情况,在“资源”页面单击“修改”修改或取消上报告警的租户目录所对应的文件目录数上限。 7.等待1分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤8。 收集故障信息 8.在FusionInsight Manager首页,选择“运维 > 日志 > 下载”。 9.在“服务”中勾选待操作集群的“HDFS”和Manager下的NodeAgent。 10.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后20分钟,单击“下载”。 11.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-14025 租户文件对象使用率超过阈值
      • ALM-12049 网络读吞吐率超过阈值
        检查阈值设置是否合理 1.在FusionInsight Manager,选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 > 网络读信息 > 读吞吐率”,查看该告警阈值是否不合理(默认80%为合理值,用户可以根据自己的实际需求调节)。 是,执行步骤2。 否,执行步骤4。 2.根据实际服务的使用情况在“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 > 网络读信息 > 读吞吐率”,单击“操作”列的“修改”更改告警阈值。 3.等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤4。 检查网口速率是否满足需求 4.打开FusionInsight Manager页面,在实时告警列表中,单击此告警所在行的,获取告警所在主机地址及网口名称。 5.以root用户登录告警所在主机。 6.执行命令ethtool 网口名称 ,查看当前网口速率最大值Speed。 说明 对于虚拟机环境,通过命令可能无法查询到网口速率,建议直接联系系统管理确认网口速率是否满足需求。 7.若网络读吞吐率超过阈值,直接联系系统管理员,提升网口速率。 8.检查该告警是否恢复。 是,处理完毕。 否,执行步骤9。 收集故障信息 9.在主集群的FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 10.在“服务”中勾选“OMS”,单击“确定”。 11.设置“主机”为告警所在节点和主OMS节点。 12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。 13.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-12049 网络读吞吐率超过阈值
      • 天翼云AOne第三方信息共享清单及SDK目录
        天翼云AOne iOS版本 第三方信息共享清单及SDK目录 名称 使用场景 使用目的 信息名称 信息类型 共享方式 开发者/公司 第三方隐私和信息处理规则/开发者协议链接 企业微信登录SDK 关联账号登录 企业微信账号授权登录 无 无 无 深圳市腾讯计算机系统有限公司 腾讯企业微信SDK隐私和信息处理规则 飞书登录SDK 关联账号登录 飞书账户授权登录 设备信息与日志信息:操作系统版本号、服务日志 个人常用设备信息 SDK本机采集 北京飞书科技有限公司 飞书登录 SDK 隐私政策 钉钉登录SDK 关联账号登录 钉钉账户授权登录 无 无 无 钉钉科技有限公司 钉钉登录SDK隐私政策 SDWebImage 图片的加载缓存 图片的加载缓存 无 无 无 社区开源项目 < AFNetworking 和后端的接口交互 进行接口的数据请求 无 无 无 社区开源项目 FMDB 本地数据的存储 数据库的管理 无 无 无 社区开源项目 SSZipArchive 分享文件时压缩文件 文件的压缩与解压 无 无 无 社区开源项目 < CocoaLumberjack 日志打印 日志打印到本地文件 无 无 无 社区开源项目 < SVGKit svg格式图片的显示 svg格式图片的显示 无 无 无 社区开源项目 < openim IM/通知号 IM通信和服务号通知 正在运行的应用安装列表、存储外部存储目录、 读取外部存储目录、存储目录管理、发送语音、拍照 个人设备信息 SDK本机采集 社区开源项目 OpenIM隐私政策 mailcore2 邮箱 获取邮箱、邮箱收发服务 无 无 SDK本机采集 < RZRichTextView 富文本 富文本编辑显示功能 无 无 无 < TZImagePickerController 相册选择 邮箱获取相册图片服务 无 无 无 < SQLCipher 邮箱数据库加密 邮箱数据库加密服务 无 无 无 <
        来自:
        帮助文档
        边缘安全加速平台
        相关协议
        天翼云AOne第三方信息共享清单及SDK目录
      • 控制台说明
        本文介绍CDN控制台概览页相关模块的用途。 天翼云CDN控制台可以帮助您新增加速域名,完成域名配置等基本操作,同时提供了数据分析和日志下载等服务,您可以了解自身业务的基本流量趋势。 CDN控制台功能界面介绍: 1. 导航栏: 控制台左侧菜单栏主要功能为概览、域名管理、证书管理、数据分析、刷新预取、日志下载、计费详情、API文档。 概览:可展示今日或本月的流量/带宽、近七天流量/带宽趋势、证书统计、域名统计、产品计费、信息中心。 域名管理:支持添加加速域名、管理、删除已有加速域名,并可以对加速域名基本信息和配置信息进行更改,支持对域名配置变更生成的域名操作工单进行状态跟踪和闭环以及历史工单溯源查询。支持标签管理功能方便客户做域名分类管理。 证书管理:可供客户自助添加、删除https证书,查看证书详情。 数据分析:数据分析模块支持客户自助查询,主要包含:用量查询、热门分析、用户分析。 刷新预取:您可以选择URL刷新、目录刷新、正则刷新和URL预取。同时您可以通过【查看任务】查看刷新、预取任务的具体状态。 日志下载:可通过搜索域名、选择时间,下载该域名在该时间段的日志。 诊断工具:可通过该诊断工具查询指定IP是否为天翼云CDN节点IP以及对应归属地。 边缘函数:可创建边缘函数、查看已创建边缘函数的使用情况。 计费详情:可查看产品按量计费和资源包使用情况。 API文档:可查看平台已支持客户调用的API功能及相关语法说明。 2. 流量/带宽: 展示客户所有域名的今日或者本月的总流量、峰值带宽。 3. 近七天趋势: 展示客户所有域名的近七天总流量趋势和带宽趋势图。 4. 证书统计: 统计客户证书总数和即将过期的证书数量。 5. 域名统计: 统计客户的域名总数,并且可以管理、添加域名,进入刷新预取的页面。 6. 产品计费: 展示客户使用的每个产品的计费方式,并且可以快捷进入订购CDN加速资源包的页面。 7. 信息中心: 该区域分为公告、域名信息、常见问题、使用手册四部分。 公告:显示更新说明、版本发布、CDN相关动态等信息。 域名信息:显示域名的操作信息。 常见问题:介绍在使用天翼云CDN中所遇到的常见问题的解决方案。 使用手册:介绍客户如何使用控制台的操作手册。 8. 语言切换: 支持客户通过语言切换按键,使用简体中文或English访问CDN控制台页面,当切换到【English】后,控制台界面将切换为全英文展示。
        来自:
        帮助文档
        CDN加速
        用户指南
        控制台说明
      • 以SkyWalking方式接入
        在监控c应用之前,您需要通过客户端将应用数据上报至APM服务端。本文介绍如何通过SkyWalking SDK上报c应用数据。 前提条件 完成vpce接入。 背景信息 SkyWalking是一款广受欢迎的国产APM(Application Performance Monitoring,应用性能监控)产品,主要针对微服务、Cloud Native和容器化(Docker、Kubernetes、Mesos)架构的应用。SkyWalking的核心是一个分布式追踪系统。 接入步骤 1、安装Agent plaintext dotnet add package SkyAPM.Agent.AspNetCore 2、查看接入点信息 应用列表的接入指引会根据您所在资源池提供v3版本接入点(Skywalking 8.)的ENDPOINT(天翼云vpc网络接入点)、鉴权TOKEN信息。 3、设置环境变量 plaintext ASPNETCOREHOSTINGSTARTUPASSEMBLIESSkyAPM.Agent.AspNetCore SKYWALKINGSERVICENAME 4、配置Agent属性 plaintext 安装SkyAPM.DotNet.CLI工具 plaintext dotnet tool install g SkyAPM.DotNet.CLI plaintext 生成配置文件skyapm.json plaintext dotnet skyapm config sampleapp 192.168.0.1:11800 plaintext skyapm.json文件内容如下 plaintext {   "SkyWalking": {     "ServiceName":  ,     "Namespace": "",     "HeaderVersions": [       "sw8"     ],     "Sampling": {       "SamplePer3Secs": 1,       "Percentage": 1.0     },     "Logging": {       "Level": "Information",       "FilePath": "logsskyapm{Date}.log"     },     "Transport": {       "Interval": 3000,       "ProtocolVersion": "v8",       "QueueSize": 30000,       "BatchSize": 3000,       "gRPC": {         "Servers":  ,         "Timeout": 10000,         "ConnectTimeout": 10000,         "ReportTimeout": 600000,         "Authentication": "Bearer  "       }     }   } } 属性说明: :服务名称 :获取的接入点 :获取的接入点鉴权令牌 Logging:日志记录与调试。Level表示日志级别,FilePath表示日志文件保存的位置以及文件名称 运行程序时,Agent的日志会记录在Logging设置的文件中,可以参考log文件进行调试和修改。
        来自:
        帮助文档
        应用性能监控 APM
        快速入门
        接入C#应用
        以SkyWalking方式接入
      • DescribeTrails
        名称 描述 trailList.Name 跟踪的名称。 trailList.S3BucketName OOS Bucket名称。 trailList.S3KeyPrefix 跟踪日志的名称前缀。 trailList.TrailARN 跟踪的ARN。
        来自:
        帮助文档
        对象存储(经典版)I型
        API参考
        操作跟踪
        操作跟踪API
        DescribeTrails
      • 自定义存储资源对象
        自定义通用PVC 当自定义存储类创建完成后,可以通过自定义PVC的方式,选择存储类,动态制备PV。 登录“云容器引擎”管理控制台; 在集群列表页点击进入指定集群; 进入主菜单“存储”——“持久卷声明”,单击左上角“创建持久卷声明”; 在创建对话框,配置持久卷声明PVC的相关参数。配置项说明如下: 配置项 说明 : 名称 PVC的名称 存储声明类型 这里选择“通用” 分配模式 这里选择“使用存储类” StorageClass名称 选择上一步创建的自定义StorageClass 容量 可以根据需求自定义容量 卷模式 支持两种卷模式: 1、文件系统(Filesystem):默认方式,该类型卷会被Pod挂载(Mount)到某个目录。如果卷的存储来自某块设备而该设备目前为空, Kuberneretes会在第一次挂载卷之前在设备上创建文件系统。 2、块设备(Block):这类卷以块设备的方式交给Pod使用,其上没有任何文件系统。这种模式对于为Pod提供一种使用最快可能方式来访问卷而言很有帮助,Pod和卷之间不存在文件系统层。 访问模式 支持选择以下访问模式: 1、ReadWriteOnce:卷可以被一个节点以读写方式挂载 2、ReadOnlyMany:卷可以被多个节点以只读方式挂载 3、ReadWriteMany:卷可以被多个节点以读写方式挂载 参数配置完成后,点击“确定”。创建成功后,可以在持久卷声明列表查看。 进入持久卷声明列表页,等待PVC状态为“已绑定” 。此时,进入主菜单“存储”——“持久卷“,可以看到对应的PV创建。 如果PVC一直未绑定,可以查看进入对应PVC详情页查看事件,或者查看CSI日志进行定位。 通用持久卷声明YAML示例如下: apiVersion: v1 kind: PersistentVolumeClaim metadata: name: {PVCNAME} spec: accessModes: ReadWriteOnce volumeMode: Filesystem resources: requests: storage: 1Gi storageClassName: {YOURSTORAGECLASSNAME}
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        存储
        自定义存储资源对象
      • 基本概念
        本文介绍镜像仓库基本概念。 镜像仓库是用于存储、管理docker容器镜像的场所,可以让使用人员轻松存储、管理、部署 docker 容器镜像。镜像仓库包括如下内容: 天翼云官方镜像:展示了天翼云平台上的公开镜像,您可以基于公开镜像创建应用; 我的镜像:展示了用户创建的所有镜像仓库。 本章节将为用户介绍容器镜像仓库的基本使用方法,说明【创建】>【上传】>【管理】的仓库使用流程,用户完成镜像上传后,即可在应用创建流程中通过选择【我的镜像】,使用用户自己上传的私有镜像部署应用。 注意事项 镜像仓库不扫描用户上传的镜像,不负责对用户上传的镜像进行安全性验证。上传的镜像中请不要包含未加密的口令,密码等隐私信息,以避免隐私泄露。用户从第三方网站下载公有镜像时,应确定数据来自于可信的仓库源,以避免下载到恶意软件; 如果使用自定义镜像,请确保镜像来源可信,不在容器镜像内安装不必要的软件,在升级时使用安全补丁升级镜像。使用第三方镜像,造成的后果(例如:环境不可用)用户需自己承担; 磁盘满将会导致无法上传镜像到仓库,将会有异常提示信息告知,但并不会影响其他服务;为防止其它业务(例如日志)把磁盘占满,导致仓库无法上传,建议对仓库的存储独立挂盘。 在使用之前,您需要了解以下基本概念: 镜像仓库: 提供docker容器镜像管理功能,用户在创建容器应用前,需要将应用所需的镜像上传到镜像仓库。docker镜像是一个模板,用于创建docker容器。docker提供了一个简单的机制来创建新的镜像或更新已有镜像。 (仓库)属性: 属性分为公有和私有两种。公有:任何租户、用户均可以下载。私有:仅当前租户或租户下的用户可用。
        来自:
        帮助文档
        云容器引擎(旧版)
        用户指南
        镜像仓库
        基本概念
      • 安装、升级与使用CTCCL库
        5.确认是否替换成功 在训练日志中,看到日志输出对应的ctccl信息。 如:CTCCL version 0. .0(nccl2.19.4)+cuda12.2 CTCCL版本升级 对于已安装NCCL或CTCCL旧版本的情况,若要安装CTCCL新版本,请确保已停止该环境所有的训练任务,升级方式和安装方法相同。 CTCCL测试 在NVIDIA平台上,可以使用NCCLTest工具测试CTCCL的性能。 测试代码下载路径: 编译: make MPI1 MPIHOME{{MPI路径}} CUDAHOME{{CUDA路径}} NCCLHOME{{NCCL路径}} j 40 使用 mpirun 启动训练进程: mpirun allowrunasroot np 2 H IP1,IP2 x NCCLIBHCAmlx52 x NCCLIBQPSPERCONNECTION8 allreduceperf b 8 e 1G f 2 g 8
        来自:
      • Init工具
        toks ["ip%s" % lhost.replace(".", "")] 屏蔽此行 toks lhost.split(".novalocal") 增加此行 if len(toks) > 1: hostname toks[0] domain '.'.join(toks[1:]) 屏蔽此行 else: hostname toks[0] if fqdn and domain ! defdomain: return hostname 屏蔽此行 return "%s.%s" % (hostname, domain) 增加此行 else: return hostname 修改完成后按“ESC”退出编辑模式,输入:wq!保存并退出。 b.执行如下命令进入“cloudinit/sources”文件夹。 cd /usr/lib/python./sitepackages/cloudinit/sources/ 不同OS安装的python版本有差异,请选择对应的路径。 c.执行如下命令,删除“init .pyc”文件和优化编译后的“init.pyo”文件。 rm rf init.pyc rm rf init.pyo d.执行如下命令,清理日志信息。 rm rf /var/lib/cloud/ rm rf /var/log/cloudinit 9.执行以下命令编辑CloudInit日志输出路径配置文件,设置日志处理方式handlers,建议配置为cloudLogHandler。 vim /etc/cloud/cloud.cfg.d/05logging.cfg [loggercloudinit] levelDEBUG qualnamecloudinit handlerscloudLogHandler propagate1 10.确保删除镜像模板中已经存在的linux帐户和“/home/linux”目录。 userdel linux rm fr /home/linux 检查CloudInit工具相关配置是否成功 执行以下命令,无错误发生,说明CloudInit配置成功。 cloudinit init local 正确安装的CloudInit会显示CloudInit的版本详细信息,并且无任何错误信息。例如,正确安装的情况下,不含有缺少文件的提示信息。 说明: 执行如下命令,可将系统用户密码有效期设置为最大。此操作可选。 chage M 99999 $username 其中,username为系统用户,例如root账户。 密码有效期建议设置为99999。
        来自:
      • ALM-14024 租户空间使用率超过阈值
        处理步骤 查看阈值设置是否合理 1.查看告警定位信息,获取上报告警的租户名称,租户目录。 2.在FusiongInsight Manager首页,在“租户资源”页面选择上报告警的租户名称,单击“资源”,查看上报告警的租户目录所对应的存储空间阈值配置设置是否合理(默认90%为合理值,用户可以根据自己的实际情况设置)。 是,执行步骤5。 否,执行步骤3。 3.根据租户空间实际的使用情况,在“资源”页面单击“修改”修改或取消上报告警的租户目录所对应的存储空间阈值配置。 4.等待1分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤5。 查看租户分配的空间容量是否合理 5.在FusionInsight Manager首页,在“租户资源”页面选择上报告警的租户名称,单击“资源”,查看上报告警的租户目录所对应的存储空间配额设置是否合理(根据该租户目录实际业务情况而定)。 是,执行步骤8。 否,执行步骤6。 6.根据该租户目录实际业务情况,在“资源”页面单击“修改”修改上报告警的租户目录所对应的存储空间配额。 7.等待1分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤8。 收集故障信息 8.在FusionInsight Manager首页,选择“运维 > 日志 > 下载”。 9.在“服务”中勾选待操作集群的“HDFS”和Manager下的NodeAgent。 10.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后20分钟,单击“下载”。 11.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-14024 租户空间使用率超过阈值
      • ALM-14010 NameService服务异常
        检查NameNode节点是否进入安全模式 19.在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > HDFS”,单击服务异常的NameService的“NameNode(主)”,显示NameNode WebUI页面。 说明 admin用户默认不具备其他组件的管理权限,如果访问组件原生界面时出现因权限不足而打不开页面或内容显示不全时,可手动创建具备对应组件管理权限的用户进行登录。 20.在NameNode WebUI,查看是否显示如下信息:“Safe mode is ON.” “Safe mode is ON.”表示安全模式已打开,后面的提示信息为告警信息,根据实际情况展现。 是,执行步骤21。 否,执行步骤24。 21.以root用户登录客户端。执行cd命令进入客户端安装目录,然后执行 source bigdataenv 。如果集群采用安全版本,要进行安全认证,执行kinit hdfs命令,按提示输入密码(向管理员获取密码)。如果集群采用非安全版本,需使用omm用户登录并执行命令,请确保omm用户具有客户端执行权限。 22.执行 hdfs dfsadmin safemode leave 。 23.在“运维 > 告警 > 告警”页签,查看该告警是否恢复。 是,处理完毕。 否,执行步骤24。 收集故障信息 24.在FusionInsight Manager首页,选择“运维 > 日志 > 下载”。 25.在“服务”中勾选待操作集群的如下节点信息。 ZooKeeper HDFS 26.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。 27.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-14010 NameService服务异常
      • ALM-16009 Map数超过阈值
        本章节主要介绍ALM16009 Map数超过阈值的告警。 告警解释 系统每30秒周期性检测执行的HQL的Map数是否超过阈值,超过阈值发出告警。系统默认的平滑次数为3次,默认阈值为5000。 告警属性 告警ID 告警级别 是否自动清除 16009 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 Hive执行的HQL的Map数过高,一方面会导致HQL执行较慢,另一方面会大量占用资源。 可能原因 执行的HQL语句存在可以优化的可能。 处理步骤 检查HQL的Map个数 1.在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > Hive > 资源”,查看“HQL的Map数”图表,找出Map数过大的HQL语句(Map数>5000)。 2.找到对应的HQL语句,优化在监控上显示map数过大的HQL语句,再尝试执行。 3.查看本告警是否恢复。 是,操作结束。 否,执行步骤4。 收集故障信息 4.在FusionInsight Manager首页,选择“运维 > 日志 > 下载”。 5.在“服务”中勾选待操作集群的“Hive”。 6.单击右上角的设置日志收集的“开始时间”和“结束时间”,分别为告警产生时间的前后10分钟,单击“下载”。 7.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-16009 Map数超过阈值
      • ALM-12077 omm用户过期
        本章节主要介绍 ALM12077 omm用户过期。 告警解释 系统每天零点开始,每8小时检测当前系统中omm用户是否过期,如果用户过期,则发送告警。 当系统中omm用户过期的期限重置,当前状态为正常,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 12077 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群或系统名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 omm用户过期,Manager各节点互信不可用,无法对服务提供管理功能。 可能原因 omm用户过期。 处理步骤 检查系统中omm用户是否过期 1.以root用户登录集群故障节点。 执行chage l omm命令来查看当前omm用户密码设置信息。 2.查找“Account expires”对应值,查看用户设置是否过期。 说明 如果参数值为“never”,则代表永不过期。 是,执行步骤3。 否,执行步骤4。 3.执行 chage E 'yyyyMMdd' omm命令设置omm 用户过期的期限,等待8小时,观察告警是否自动清除。 是,操作结束。 否,执行步骤4。 收集故障信息 4.在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 5.在“服务”中勾选“NodeAgent”,单击“确定”。 6.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分,单击“下载”。 7.请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-12077 omm用户过期
      • ALM-12052 TCP临时端口使用率超过阈值
        检查系统环境是否异常 7.执行以下命令导入临时文件,并查看“portresult.txt”文件中高使用率端口。 netstattnpsort > $BIGDATAHOME/tmp/portresult.txt netstat tnpsort Active Internet connections (w/o servers) Proto Recv Send LocalAddress ForeignAddress State PID/ProgramName tcp 0 0 1012085154:45433 1012085154:9866 CLOSEWAIT 94237/java tcp 0 0 1012085154:45434 1012085154:9866 CLOSEWAIT 94237/java tcp 0 0 1012085154:45435 1012085154:9866 CLOSEWAIT 94237/java ... 8.执行如下命令,查看占用大量端口的进程。 ps ef grep PID 说明 PID为步骤7查询出所属端口的进程号。 可以执行如下命令,收集系统所有进程信息,查看占用大量端口的进程。 ps ef > $BIGDATAHOME/tmp/psresult.txt 9.请系统管理员确认后,清除大量占用端口的进程,等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤10。 收集故障信息 10.在主集群的FusionInsight Manager界面,选择“运维 > 日志 > 下载”。 11.在“服务”中勾选“OMS”,单击“确定”。 12.设置“主机”为告警所在节点和主OMS节点。 13.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。 14.请联系运维人员,发送已收集的故障日志信息及“portresult.txt”和“psresult.txt”文件,并删除环境中残留的两个临时文件。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 无。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-12052 TCP临时端口使用率超过阈值
      • IAM用户同步MRS说明
        操作步骤 1.创建用户并授权使用MRS服务,具体请参考创建MRS操作用户。 2.登录MRS控制台并创建集群,具体请参考创建自定义集群。 3.在左侧导航栏中选择“集群列表 > 现有集群”,单击集群名称进入集群详情页面。 4.在“概览”页签的基本信息区域,单击“IAM用户同步”右侧的“单击同步”进行IAM用户同步。 5.同步请求下发后,返回MRS控制台在左侧导航栏中选择“操作日志”页面查看同步是否成功,日志相关说明请参考查看MRS服务操作日志。 6.同步成功后,即可使用IAM同步用户进行后续操作。 说明 l 当IAM用户的用户组的所属策略从MRS ReadOnlyAccess向MRS CommonOperations、MRS FullAccess、MRS Administrator变化时,由于集群节点的SSSD(System Security Services Daemon)缓存刷新需要时间,因此同步完成后,请等待5分钟,等待新修改策略生效之后,再进行提交作业。否则,会出现提交作业失败的情况。 l 当IAM用户的用户组的所属策略从MRS CommonOperations、MRS FullAccess、MRS Administrator向MRS ReadOnlyAccess变化时,由于集群节点的SSSD缓存刷新需要时间,因此同步完成后,请等待5分钟,新修改策略才能生效。 l 单击“IAM用户同步”右侧的“同步”后,集群详情页面会出现短时间空白,这是由于正在进行用户数据同步中,请耐心等待,数据同步完成后,页面将会正常显示。 l 安全集群提交作业:安全集群中用户可通过界面“作业管理”功能提交作业,具体请参考
        来自:
        帮助文档
        翼MapReduce
        用户指南
        准备用户
        IAM用户同步MRS说明
      • 态势感知(专业版)的数据来源是什么?
        态势感知的数据来源。 态势感知(专业版)基于云上威胁数据和云服务采集的威胁数据,通过大数据挖掘和机器学习,分析并呈现威胁态势,并提供防护建议。 一方面采集全网流量数据,以及安全防护设备日志等信息,通过大数据智能AI分析采集的信息,呈现资产的安全状况,并生成相应的威胁告警。 另一方面汇聚企业主机安全(Host Security Service,HSS)、Web应用防火墙(Web Application Firewall,WAF)等安全防护服务上报的告警数据,从中获取必要的安全事件记录,进行大数据挖掘和机器学习,智能AI分析并识别出攻击和入侵,帮助用户了解攻击和入侵过程,并提供相关的防护措施建议。 态势感知(专业版)通过对多方面的安全数据的分析,为安全事件的处置决策提供依据,实时呈现完整的全网攻击态势。
        来自:
        帮助文档
        态势感知(专业版)(新版)
        常见问题
        产品咨询
        态势感知(专业版)的数据来源是什么?
      • 1
      • ...
      • 94
      • 95
      • 96
      • 97
      • 98
      • ...
      • 490
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      聚力AI赋能 天翼云大模型专项

      大模型特惠专区·Token Plan 轻享包低至9.9元起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      企业出海解决方案

      助力您的业务扬帆出海,通达全球!

      天翼云信创专区

      “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      物理机 DPS

      弹性伸缩服务 AS

      天翼云CTyunOS系统

      AI Store

      公共算力服务

      Token服务

      应用托管

      知识库问答

      人脸检测

      推荐文档

      复制备份

      续订

      域名的种类

      天翼云进阶之路⑥:Windows和Linux绑定多网卡多EIP

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 息壤智算平台
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号