云日志服务_云日志服务文档介绍内容-天翼云

使用类问题
数据库审计如何对日志进行快速检索？日志查询分析菜单 > 日志检索功能，提供根据时间范围、资产、类型等条件对审计日志进行检索，同时支持关键词搜索和高级（自定义过滤逻辑条件）查询，并保存常用历史查询信息，便于后续对所需日志进行快速检索。数据库审计如何配置告警规则？规则配置菜单 > 安全规则，通过启用产品内置的规则或用户自定义新增规则，配置告警的触发条件（敏感库表字段、行为等）和风险等级，根据相应的条件触发告警日志。可以不断优化告警配置，提升告警准确性。数据库审计如何进行查看报表分析？报表中心模块 > 报表预览，选择对应的报表及资产、时间范围进行报表生成。数据库审计采集日志需要做哪些操作？进入数据库审计后，您需要先配置审计资产，在应用/数据库服务器上部署agent产生审计日志，以及启用告警规则，对可疑行为进行风险告警。可在平台中检索审计到的审计日志和告警日志。

来自：
帮助文档
数据库审计
常见问题
使用类问题
跨源连接运维报错
本章节主要介绍跨源连接相关问题中有关跨源连接运维报错的问题。新建跨源连接，显示已激活，但使用时报communication link failure错误原因网络连通性问题，建议用户检查安全组选择是否正确，检查安全组网络（vpc）配置。解决方法：示列：创建RDS跨源，使用时报“communication link failure”错误。 a. 将原有跨源连接删除重新创建。再次创建时，必须确保所选“安全组”、“虚拟私有云”、“子网””和“目的地址”与RDS中的设置完全一致。说明请选择正确的“服务类型”，本示例中为“RDS”。 b.检查安全组网络（vpc）配置。若按照步骤1重建跨源连接后还是报错“communication link failure”，则检查vpc配置。跨源访问MRS HBase，连接超时，日志未打印错误用户在跨源连接中没有添加集群主机信息，导致KRB认证失败，故连接超时，日志也未打印错误。建议配置主机信息后重试。在“增强型跨源”页面，单击该连接“操作”列中的“修改主机信息”，在弹出的对话框中，填写主机信息。格式为：“IP 主机名/域名”，多条信息之间以换行分隔。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节。 DLI跨源连接报错找不到子网跨源连接创建对等连接失败，报错信息如下： Failed to get subnet 2c2bd2ed72964c649b60ca25b5eee8fe. Response code : 404, message : {"code":"VPC.0202","message":"Query resource by id 2c2bd2ed72964c649b60ca25b5eee8fe fail.the subnet could not be found."} 创建跨源连接之前，需要确认是否勾选了“VPC Administrator”，如果只是勾选了全局的tenant administrator，会提示找不到子网。

来自：
帮助文档
数据湖探索
常见问题
操作类
跨源连接相关问题
跨源连接运维报错
产品优势
大模型安全测评一站式服务提供安全测评到优化建议的一站式服务。同时，我们可以根据客户的业务需求和安全目标提供测评方案。无论是针对特定行业的大模型应用，还是特定场景下的安全需求，提供精准的测评服务，帮助客户解决实际问题。大模型安全护栏全链路防护同时覆盖文本输入、文本输出、图片三个检测维度，实现从用户输入到大模型输出的端到端安全闭环，无死角守护大模型应用安全。低侵入快速接入基于标准 REST API，无需改造现有业务架构与模型部署方式，开发者仅需在调用大模型前后各增加一次 API 调用，即可完成安全护栏的嵌入。自定义安全策略支持企业自定义黑名单词库（精准拦截特定词语）与白名单词库（豁免特定词语），以及为不同风险类型配置个性化代答话术，满足不同行业、不同业务场景的定制化需求。实时日志审计所有检测请求均实时记录日志，支持按服务类型、建议动作、时间范围等多维度筛选查询，并可导出备份，满足企业合规审计要求。在线即时体验控制台内置在线测试功能，提供丰富的预设风险场景用例，无需编写任何代码即可快速验证检测效果，降低接入门槛。多应用隔离管理支持为不同业务线创建相互独立的应用，各应用拥有独立的 API 调用凭证与策略配置，实现权限隔离与用量独立统计。

来自：
帮助文档
智算安全专区
产品介绍
产品优势
ALM-12038 监控指标转储失败
查看服务器端保存路径权限是否正常 5. 选择“系统 > 对接 > 监控数据上传”，查看“FTP用户名”、“保存路径”和“转储模式”配置项。是FTP模式，执行步骤6。是SFTP模式，执行步骤7。 6. 以FTP方式登入服务器，在默认目录下查看相对路径“保存路径”是否有“FTP用户名”的读写权限。是，执行步骤9。否，执行步骤8。 7. 以SFTP方式登入服务器，查看绝对路径“保存路径”是否有“FTP用户名”的读写权限。是，执行步骤9。否，执行步骤8。 8. 增加读写权限，然后检查告警是否恢复。是，执行完毕。否，执行步骤9。查看服务器端保存路径是否有足够磁盘空间 9. 登录服务器端，查看当前保存路径下是否有足够磁盘空间。是，执行步骤11。否，执行步骤10。 10. 删除多余文件，或在监控指标转储配置页面更改保存目录。然后检查告警是否恢复。是，执行完毕。否，执行步骤11。收集故障信息 11. 在FusionInsight Manager界面，选择“运维 > 日志 > 下载”。 12. 在“服务”中勾选“OMS”，单击“确定”。 13. 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后60分钟，单击“下载”。 14. 请联系运维人员，并发送已收集的故障日志信息。告警清除此告警修复后，系统会自动清除此告警，无需手工清除。参考信息无。

来自：
帮助文档
翼MapReduce
用户指南
FusionInsight Manager操作指导（适用于3.x）
告警参考（适用于MRS 3.x版本）
ALM-12038 监控指标转储失败
灰度升级
本节介绍了灰度升级的相关内容。操作场景当涉及新功能或问题修复等需要进行版本升级时，云数据库GaussDB提供了灰度升级的方式，灰度升级支持升级自动提交和升级待观察两种操作方式。升级自动提交是先升级所有备DN，再升级主DN，最后升级CN，升级完成后会自动提交升级。升级待观察又名滚动升级。升级待观察方式升级完成后进入观察状态，可以在此期间观察业务状态，根据业务情况选择提交或回退本次升级。 − 分布式版实例按照分片进行滚动，操作请参见分布式版实例升级。 − 集中式版实例按照AZ进行滚动，操作参见集中式版实例升级。操作流程操作步骤说明步骤一：升级前检查版本升级前需要检查实例状态和实例的CPU使用率、内存使用率、磁盘使用率等监控指标是否正常。步骤二：升级操作支持两种升级方式：升级自动提交和升级待观察。用户可以根据需要选择单个实例升级，也可以选择批量升级多个实例。步骤三：升级后验证升级完成后需要检查升级后的实例状态、备份创建、连接实例是否正常，能否进行正常的增加、删除、修改、查询操作。注意事项 DN磁盘使用率不得高于设置磁盘使用率阈值减去10%的值。说明 DN磁盘使用率可以通过管理控制台监控指标查看。磁盘使用率阈值可以联系技术支持人员获取。实例节点状态异常，不支持版本升级。升级待观察方式支持手动回退操作，升级自动提交不支持手动回退操作。版本升级/回退过程中不支持磁盘扩容、规格变更、备份、重置密码、重启实例、删除实例等操作。建议在业务较小的时候执行版本升级操作，以确保CPU，磁盘，内存使用率等都有较大的空闲。在大版本升级时如果使用升级自动提交方式，在执行升级前会关闭归档日志，用户无法通过归档日志进行PITR恢复，可能会造成数据丢失。在大版本升级时如果使用升级待观察方式，升级过程中全量备份将无法触发，差量备份可能失败。升级观察期间待所有AZ都升级完成后才允许执行手动全量备份，在提交升级前仍会进行归档日志，用户可以通过归档日志进行PITR恢复，保证数据不会丢失。提交升级时会关闭归档日志。如果升级过程中出现异常导致升级失败，系统会自动对实例进行回退，您可以联系技术支持，由工程师给出分析评估后重新执行升级。在升级主DN和CN的过程中分别会有一次10秒左右的业务中断。升级结束后会触发自动备份，开启关闭的归档日志。需要注意的是小版本升级不会触发自动备份。仅V2.02.2以上版本的实例才能进行归档日志。说明小版本升级，例如：从V2.01.a.x升级到V2.01.a.y或者V2.02.a.x升级到V2.02.a.y。大版本升级，例如：V2.01.x升级V2.02.x或者V2.02.x到V2.02.y等。

来自：
帮助文档
云数据库GaussDB
用户指南
版本升级
灰度升级
云容器集群节点网络包乱序
3、配置全局策略 1. 在全局配置页面，按需添加保护策略和监控指标。 2. 配置完成后，单击完成按钮，创建演练任务。 4、发起故障注入 1. 发起演练：在演练管理列表找到对应演练任务，单击操作列的执行演练，在新页面中点击发起新演练。 2. 进入实验：系统将自动跳转到本次演练的运行详情页，或在演练执行记录列表点击对应执行实例的详情进入。 3. 注入故障：在动作组中，找到网络包乱序动作卡片，单击执行。 4. 查看日志：单击动作卡片本身，在右侧弹出的侧边栏中查看执行详情。效果验证在故障注入期间，您可以通过以下方式验证演练效果： 1、观测实例指标：登录应用性能监控控制台，观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证：观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时，是否出现性能下降、卡顿或功能异常。某些对数据包顺序敏感的应用层协议（如HTTP/2的部分场景、实时音视频流）可能会出现解析错误或连接中断。检查应用日志，确认是否有因超时或数据完整性问题而产生的错误。

来自：
帮助文档
应用高可用
用户指南
故障演练服务
故障动作库
云容器
云容器引擎
云容器集群节点网络包乱序
ALM-19006 HBase容灾同步失败
检查主备集群RegionServer之间的网络连接 14.登录主集群FusionInsight Manager界面，选择“运维 > 告警 > 告警”。 15.在告警列表中单击该告警，从完整的告警信息中“定位信息”处获得“主机名”。 16.以omm用户通过步骤15获取的IP地址登录故障RegionServer节点。 17.执行ping命令，查看故障RegionServer节点和备集群RegionServer所在主机的网络连接是否正常。是，执行步骤20。否，执行步骤18。 18.联系网络管理员恢复网络。 19.网络恢复后，在告警列表中，查看本告警是否清除。是，处理完毕。否，执行步骤20。收集故障信息 20.在主备集群的FusionInsight Manager界面，选择“运维 > 日志 > 下载”。 21.在“服务”中勾选待操作集群的“HBase”。 22.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟，单击“下载”。 23.请联系运维人员，并发送已收集的故障日志信息。告警清除此告警修复后，系统会自动清除此告警，无需手工清除。参考信息无。

来自：
帮助文档
翼MapReduce
用户指南
FusionInsight Manager操作指导（适用于3.x）
告警参考（适用于MRS 3.x版本）
ALM-19006 HBase容灾同步失败
执行流程
执行流程概述在创建流程后,您可以通过多种方式触发、执行流程,并在执行后查看执行结果流程支持以下触发方式:手动触发:在云工作流控制台直接启动流程。定时触发:设置定时任务,按照指定的时间周期自动执行流程执行流程概述在创建流程后，您可以通过多种方式触发、执行流程，并在执行后查看执行结果流程支持以下触发方式：手动触发：在云工作流控制台直接启动流程。定时触发：设置定时任务，按照指定的时间周期自动执行流程。队列消息触发：通过将消息发送至消息队列来触发工作流流程。事件触发：通过监听其他天翼云服务（如对象存储、云日志等）的事件来触发工作流流程。 HTTP触发：通过调用云工作流的API接口来启动流程。本文将以云工作流控制台为例，演示如何执行流程并查看结果。操作步骤 1. 登录云工作流控制台，然后在顶部菜单栏选择地域(可选)。 2. 在左侧导航栏，选择工作流列表，然后在工作流列表页面，单击目标工作流。 3. 在工作流详情页面的执行记录页签，单击启动执行。在执行工作流面板，填写执行名称（可选）和执行输入（可选），然后单击确定。 1. 注意事项：若填写执行输入，需为合法 JSON 对象格式。 1. 执行完成后，您可在执行历史详情页中查看每个节点的执行结果、输入、输出、执行时间等详细信息，以确认流程按预期完成。执行结果的详细介绍请参见工作流执行管理。

来自：
帮助文档
函数计算
用户指南
云工作流
快速入门
执行流程
创建MRS操作用户
MRS权限说明默认情况下，管理员创建的IAM用户没有任何权限，需要将其加入用户组，并给用户组授予策略或角色，才能使得用户组中的用户获得对应的权限，这一过程称为授权。授权后，用户就可以基于被授予的权限对云服务进行操作。 MRS部署时通过物理区域划分，为项目级服务。授权时，“作用范围”需要选择“区域级项目”，然后在指定区域对应的项目中设置相关权限，并且该权限仅对此项目生效；如果在“所有项目”中设置权限，则该权限在所有区域项目中都生效。访问MRS时，需要先切换至授权区域。权限根据授权精细程度分为角色和策略。角色：IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度，提供有限的服务相关角色用于授权。由于各服务之间存在业务依赖关系，因此给用户授予角色时，可能需要一并授予依赖的其他角色，才能正确完成业务。角色并不能满足用户对精细化授权的要求，无法完全达到企业对权限最小化的安全管控要求。策略：IAM最新提供的一种细粒度授权的能力，可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式，能够满足企业对权限最小化的安全管控要求。例如：针对MRS服务，管理员能够控制IAM用户仅能对集群进行指定的管理操作。如不允许某用户组删除集群，仅允许操作MRS集群基本操作，如创建集群、查询集群列表等。多数细粒度策略以API接口为粒度进行权限拆分。如下表所示，包括了MRS的所有系统策略。 MRS系统策略策略名称描述策略类别 MRS FullAccess MRS管理员权限，拥有该权限的用户可以拥有MRS所有权限。细粒度策略 MRS CommonOperations MRS服务普通用户权限，拥有该权限的用户可以拥有MRS服务使用权限，无新增、删除资源权限。细粒度策略 MRS ReadOnlyAccess MRS服务只读权限，拥有该权限的用户仅能查看MRS的资源。细粒度策略 MRS Administrator 操作权限：对MRS服务的所有执行权限。拥有该权限的用户必须同时拥有Tenant Guest和Server Administrator权限。 RBAC策略下表列出了MRS常用操作与系统权限的授权关系，您可以参照该表选择合适的系统权限。常用操作与系统策略的授权关系操作 MRS FullAccess MRS CommonOperations MRS ReadOnlyAccess MRS Administrator 创建集群 √ x x √ 调整集群 √ x x √ 升级节点规格 √ x x √ 删除集群 √ x x √ 查询集群详情 √ √ √ √ 查询集群列表 √ √ √ √ 设置弹性伸缩策略 √ x x √ 查询主机列表 √ √ √ √ 查询操作日志 √ √ √ √ 创建并执行作业 √ √ x √ 停止作业 √ √ x √ 删除单个作业 √ √ x √ 批量删除作业 √ √ x √ 查询作业详情 √ √ √ √ 查询作业列表 √ √ √ √ 新建文件夹 √ √ x √ 删除文件 √ √ x √ 查询文件列表 √ √ √ √ 批量操作集群标签 √ √ x √ 创建单个集群标签 √ √ x √ 删除单个集群标签 √ √ x √ 按照标签查询资源列表 √ √ √ √ 查询集群标签 √ √ √ √ 访问Manager页面 √ √ x √ 查询补丁列表 √ √ √ √ 安装补丁 √ √ x √ 卸载补丁 √ √ x √ 运维通道授权 √ √ x √ 运维通道日志共享 √ √ x √ 查询告警列表 √ √ √ √ 订阅告警消息提醒 √ √ x √ 提交SQL语句 √ √ x √ 查询SQL结果 √ √ x √ 取消SQL执行任务 √ √ x √

来自：
帮助文档
翼MapReduce
用户指南
准备用户
创建MRS操作用户
基本概念
本节主要描述在使用云容器引擎前,需理解该产品所涉及的概念,以便于您更好地理解容器产品。关键词说明集群集群指容器运行所需要的云资源组合，关联了若干服务器节点、负载均衡、专有网络等云资源。专有版集群：需要创建1个Master（非高可用），或者3/5个Master（高可用）节点，以及若干Worker节点，可对集群基础设施进行更细粒度的控制，需要自行规划、维护、升级服务器集群。托管版集群：只需创建Worker节点，Master节点由CCSE创建并托管，具备操作简单、低成本无需运维等特点。节点一台服务器（可以是虚拟机实例或者物理服务器）已经安装了Docker Engine，可以用于部署和管理容器。容器的Agent程序会被安装到节点上并注册到一个集群上。专有网络VPC 专有网络VPC是您自己独有的云上私有网络。您可以完全掌控自己的专有网络，例如选择IP地址范围、配置路由表和网关等，您可以在自己定义的专有网络中使用天翼云资源如云服务器、云数据库和负载均衡等。安全组安全组是一种虚拟防火墙，具备状态检测和数据包过滤能力，用于在云端划分安全域。安全组是一个逻辑上的分组，由同一地域内具有相同安全保护需求并相互信任的实例组成。应用目录应用目录功能集成了Helm，提供了Helm的相关功能，并进行了相关功能扩展，例如提供图形化界面。编排模板编排模板是一种保存Kubernetes YAML格式编排文件的方式。 Kubernetes Kubernetes是一个开源平台，具有可移植性和可扩展性，用于管理容器化的工作负载和服务，简化了声明式配置和自动化。容器（Container）打包应用及其运行依赖环境的技术，一个节点可运行多个容器。镜像（Image）容器镜像是容器应用打包的标准格式，封装了应用程序及其所有软件依赖的二进制数据。镜像仓库（Image Registry）容器镜像仓库是一种存储库，用于存储Kubernetes和基于容器应用开发的容器镜像。管理节点（Master Node）管理节点是Kubernetes集群的管理者，运行着的服务包括kubeapiserver、kubescheduler、kubecontrollermanager、etcd组件，和容器网络相关的组件。工作节点（Worker Node）工作节点是Kubernetes集群中承担工作负载的节点，可以是虚拟机也可以是物理机。工作节点承担实际的Pod调度以及与管理节点的通信等。一个工作节点上的服务包括Docker运行时环境、kubelet、KubeProxy以及其它一些可选的组件。命名空间（Namespace）命名空间为Kubernetes集群提供虚拟的隔离作用。Kubernetes集群初始有3个命名空间，分别是默认命名空间default、系统命名空间kubesystem和kubepublic，除此以外，管理员可以创建新的命名空间以满足需求。容器组（Pod） Pod是Kubernetes部署应用或服务的最小的基本单位。一个Pod封装多个应用容器（也可以只有一个容器）、存储资源、一个独立的网络IP以及管理控制容器运行方式的策略选项。副本控制器（ReplicationController，RC） RC确保任何时候Kubernetes集群中有指定数量的Pod副本在运行。通过监控运行中的Pod来保证集群中运行指定数目的Pod副本。指定的数目可以是多个也可以是1个；少于指定数目，RC就会启动运行新的Pod副本；多于指定数目，RC就会终止多余的Pod副本。副本集（ReplicaSet，RS） ReplicaSet（RS）是RC的升级版本，唯一区别是对选择器的支持，RS能支持更多种类的匹配模式。副本集对象一般不单独使用，而是作为Deployment的理想状态参数使用。工作负载（Workload）工作负载是在Kubernetes上运行的应用程序。标签（Label） Labels的实质是附着在资源对象上的一系列Key/Value键值对，用于指定对用户有意义的对象的属性，标签对内核系统是没有直接意义的。标签可以在创建一个对象的时候直接赋予，也可以在后期随时修改，每一个对象可以拥有多个标签，但key值必须唯一。服务（Service） Service是Kubernetes的基本操作单元，是真实应用服务的抽象，每一个服务后面都有很多对应的容器来提供支持，通过KubeProxy的ports和服务selector决定服务请求传递给后端的容器，对外表现为一个单一访问接口。路由（Ingress） Ingress是授权入站连接到达集群服务的规则集合。您可以通过Ingress配置提供外部可访问的URL、负载均衡、SSL、基于名称的虚拟主机等。通过POST Ingress资源到API Server的方式来请求Ingress。Ingress Controller负责实现Ingress，通常使用负载均衡器，它还可以配置边界路由和其他前端，这有助于以高可用的方式处理流量。配置项（ConfigMap）配置项可用于存储细粒度信息如单个属性，或粗粒度信息如整个配置文件或JSON对象。您可以使用配置项保存不需要加密的配置信息和配置文件。保密字典（Secret）保密字典用于存储在Kubernetes集群中使用一些敏感的配置，例如密码、证书等信息。卷（Volume）和Docker的存储卷有些类似，Docker的存储卷作用范围为一个容器，而Kubernetes的存储卷的生命周期和作用范围是一个Pod。每个Pod中声明的存储卷由Pod中的所有容器共享。存储卷（Persistent Volume，PV） PV是集群内的存储资源，类似节点是集群资源一样。PV独立于Pod的生命周期，可根据不同的StorageClass类型创建不同类型的PV。存储卷声明（Persistent VolumeClaim，PVC） PVC是资源的使用者。类似Pod消耗节点资源一样，而PVC消耗PV资源。存储类（StorageClass）存储类可以实现动态供应存储卷。通过动态存储卷，Kubernetes将能够按照用户的需要，自动创建其所需的存储。弹性伸缩（Autoscaling）弹性伸缩是根据业务需求和策略，经济地自动调整弹性计算资源的管理服务。典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。可观测性（Observability） Kubernetes可观测性体系包含监控和日志两部分，监控可以帮助开发者查看系统的运行状态，而日志可以协助问题的排查和诊断。 Helm Helm是Kubernetes包管理平台。Helm将一个应用的相关资源组织成为Charts，然后通过Charts管理程序包。节点亲和性（nodeAffinity）节点亲和性指通过Worker节点的Label标签控制Pod部署在特定的节点上。污点（Taints）污点和节点亲和性相反，它使节点能够排斥一类特定的Pod。容忍（Tolerations）应用于Pod上，允许（但并不要求）Pod调度到带有与之匹配的污点的节点上。应用亲和性（podAffinity）应用亲和性决定应用Pod可以和特定Pod部署在同一拓扑域。例如，对于相互通信的服务，可通过应用亲和性调度，将其部署到同一拓扑域（例如同一个主机）中，以减少它们之间的网络延迟。应用反亲和性（podAntiAffinity）应用反亲和性决定应用Pod不与特性Pod部署在同一拓扑域。例如，将一个服务的Pod分散部署到不同的拓扑域（例如不同主机）中，以提高服务本身的稳定性。服务网格（Istio） Istio是一个提供连接、保护、控制以及观测服务的开放平台，兼容社区Istio开源服务网格，用于简化服务的治理，包括服务调用之间的流量路由与拆分管理、服务间通信的认证安全以及网格可观测性能力。

来自：
帮助文档
云容器引擎专有版/托管版
产品介绍
基本概念
迁移步骤
执行迁移对于Windows客户端，执行import.bat启动迁移，步骤如下： 1. 打开“开始”菜单，搜索“cmd”，打开命令提示符窗口。 2. cd到压缩工具所在的目录下，例如 cd c:CTYUNOOSImport1.3.2。 3. 执行import.bat。对于Linux客户端，执行import.sh启动迁移，步骤如下： 1. 为import.sh增加执行权限，执行命令：chmod +x import.sh。 2. 运行import.sh，执行命令：./import.sh。断点续传数据迁移工具支持断点续传，如果迁移过程中程序被终止了，可以重新启动迁移任务，从之前中断的位置继续开始迁移。继续迁移的步骤如下： 1. 保留上次迁移执行过程中产生的backup文件。如果是在另外一台服务器上重新开始迁移任务，需要将backup文件拷贝到新服务器的迁移工具所在目录下。 2. （可选）查看nextMarker.txt文件中记录的上次数据迁移位置。修改migrate.conf，设置srcMarker为上次迁移位置。日志数据迁移工具执行过程中，会生成一个migratelog文件夹，用于记录迁移情况。日志类型分为异常日志、成功日志、跳过文件（Object）日志、其他日志。运行日志生成在logs/migrate文件夹下，根据log4j2.xml配置可生成server.log、error.log、dubug.log等。

来自：
Redis使用常见问题
客户端最大连接数最大多少？单机主备或者每个代理层接入机默认最大连接数是10000；连接数不是越多越好，建议控制连接数不超过3000。备份策略有哪些？支持手动和周期自动备份；最大提供3份备份副本，超出可选择删除再次进行备份。过期逐出策略是怎样的？主动过期，系统周期性的检测，发现已过期的key时，会将其删除。惰性删除，当个key被访问时，如果已经过期，则将其删除。 Redis实例支持的单个Key和Value数据大小是否有限制？数据大小：单条记录(key+value)建议大小不超过32K；内存使用率多少比较合适？内存使用： redis实例内存使用率最好不要超过80%，建议为6070%；预留20%应对突发流量和实例运维。 redis实例使用慢日志查询？进入redis集群管理，点开慢日志菜单，选择对应redis节点查询是否有慢查询，redis默认服务侧耗时超过10ms为慢日志。具体操作请参考慢日志查询如何在控制台页面操作redis实例？点击“命令窗口”标签页，可进入命令窗口页面。选择DB，可以在命令行窗口执行redis命令，操作对应DB中的数据。通过命令设置redis密码，为何重启后失效？使用命令设置的密码只临时生效，重启后失效。需要将修改配置文件才能永久生效，可以修改密码后再执行config rewrite 将当前所使用的配置记录到 redis配置文件中。 redis的db数量有多少？每个实例支持256个DB，范围[0,256]

来自：
帮助文档
分布式缓存服务Redis版
常见问题
Redis使用
Redis使用常见问题
微服务治理中心
核心功能功能说明专业版企业版服务查询支持查看应用下服务的提供者、消费者和接口元数据等信息。 √ √ 微服务可观测支持查看最近5分钟的监控数据。 √ √ 金丝雀发布支持在应用发布时，可以为新版本的应用打上gray的标签，通过按流量比例路由或按内容路由的方式，将灰度流量引入带有gray标签的应用中，从而达到小规模验证的目的。 √ √ 标签路由支持将每个服务打上一个标签，通过标签将标签相同的服务分为同一个分组，然后约束流量在同一个分组内流转。 √ √ 无损上下线无损上线：支持在服务上线时，提供服务预热、延迟注册服务的能力解决流量损失问题。无损下线：保证应用在下线、重启时流量零损耗。 √ √ 错误注入支持模拟微服务间异常调用。 √ √ 离群实例摘除支持监测下游实例的可用性，并摘除异常实例。 √ √ 推空保护支持当注册中心返回了空列表，此时客户端忽略该空返回的变更，从缓存中获取上一次正常的服务端地址进行服务访问。 √ √ 服务鉴权支持为提供者的服务设置鉴权规则，允许或拒绝某个消费者访问服务。 √ √ 服务测试支持在控制台填写调用参数、发起服务调用，并得到服务调用的结果。 √ √ 自动化回归支持通过用例管理和用例集管理能力实现功能快速回归。 √ √ 服务Mock 支持模拟真实后端服务。 √ √ 事件中心支持通过事件类型和事件来源维度查询事件记录，感知微服务治理事件。 √ √ 操作日志支持记录关键治理中心操作日志。 √ √ 流量防护支持以流量为切入口，对请求流量进行流量控制、熔断降级和系统保护等操作。 × √ 网关防护支持针对SpringCloud Gateway和Zuul应用实现流量控制。 × √ 全链路灰度支持将多个相同版本的应用划分为同一个泳道，通过全链路流量控制的功能将相同版本的应用隔离成一个独立的运行环境（泳道）。 × √ 功能开关提供了一个轻量级的动态配置框架，可以在项目中快速接入配置，并在控制台实时管理配置项。 × √ 数据库治理支持SQL监控统计、SQL流量防护、连接池治理、数据库灰度、数据库读写路由等功能。 × √ 全局鉴权支持通过创建鉴权规则，实现多个微服务之间通信的身份验证。 × √

来自：
帮助文档
微服务引擎
产品简介
产品规格
微服务治理中心
通过智能管理面板配置OpenClaw(1)
本文介通过智能管理面板配置绍OpenClaw的内容。前置说明 1.该文档为介绍通过应用托管应用市场体验OpenClaw 智能管理面板的内容。 2.本产品中的应用由第三方主体提供，尽管天翼云已尽最大努力进行识别和维护，但仍无法保证应用的可用性。请客户按照该产品的服务协议使用该产品，做好甄别工作，并对自行选择的服务承担相应责任。概述 OpenClaw智能管理面板是集网关连接、模型配置、会话交互、日志调试、节点管理于一体的可视化操作界面。面板采用轻量化侧边栏布局，功能模块划分清晰，保障 AI 智能体的高效使用。以下为详细操作步骤。重要：OpenClaw 为开源 AI 助手，请在使用前充分评估其安全性与稳定性并严格遵循许可协议，以切实保障您的系统环境与数据安全。 1. 请避免在 OpenClaw 中绑定生产级敏感账号。如需使用 API 服务，建议使用受限的 API Key 或临时 Token，并建立定期轮换机制，以降低密钥泄露带来的风险。 2. 建议优先使用天翼云官方提供的skills与插件，避免安装来源不明的第三方技能，防止恶意代码注入。 3. 请通过密码或 Token 对 OpenClaw 服务进行访问授权，严格限制访问 IP 范围，避免公网暴露，拦截非授权访问请求。 4. 建议启用详细的日志记录与行为监控，对操作行为和数据处理过程进行持续审计，及时发现并处置异常行为。

来自：
创建智能路由
2、查看智能路由状态智能路由创建完成后，点击右上角刷新按钮，查看状态，如下图所示：后台资源就绪约5s左右，智能路由状态处于运行中即可对外提供服务。 3、查看智能路由日志信息通过切换Pod列表查看不同网关实例的日志信息。 4. 查看智能路由监控信息注意需要有访问记录才能生成智能路由监控指标信息。 5、访问智能路由调用信息创建智能路由成功后，会生成调用信息，如下图所示：调用信息跟选择的网关实例有关，若网关绑定公网访问型的负载均衡，则会显示公网调用地址和VPC调用地址，否则只会显示VPC调用地址。 Host配置由于网关可关联多个智能路由，为了区分后端服务，采用如下命名规则： shell Host: ${inferenceName}scheduler.${namespace}.inference.cn 服务调用 VPC内访问（1）访问示例 shell curl H "Host: inferencero04orscheduler.ir.inference.cn" H "ContentType: application/json" d '{ "model": "inferencero04or", "prompt": "San Francisco is a", "maxtokens": 7, "temperature": 0 }' （2）访问结果 PortForward访问（1）本地映射网关实例服务端口进入主菜单：网络>服务，选择命名空间icce，输入实例名称进行搜索（2）端口映射 shell

来自：
帮助文档
智算套件
用户指南
推理应用
智能路由
创建智能路由
API审计
本章节介绍API审计日志功能概述 API审计日志功能通常用于记录和跟踪用户在操作服务网格控制台时产生的写行为，便于管理者对控制台的行为进行追溯。审计日志内容主要记录了执行时间、操作类型、操作结果状态以及操作人等关键信息。同时，用户可以通过执行时间、操作人以及业务类型等多种条件进行数据筛选和查看。操作在控制台>网格安全中心> 审计日志菜单下，即可看到相关的日志信息，如下图：

来自：
帮助文档
应用服务网格
用户指南
网格安全中心
API审计
翼MR管理控制台和翼MR Manager页面区别与联系？
常用操作翼MR控制台翼MR Manager 查看集群基础信息、IAM同步支持不支持配置升级、远程连接、绑定/解绑弹性IP 支持不支持操作日志支持支持用户管理支持不支持访问链接与端口支持不支持启动服务、停止服务、滚动重启服务不支持支持启动、停止、重启、滚动停止、滚动重启实例不支持支持查看监控、告警信息不支持支持 LDAP租户管理不支持支持运维与配置管理不支持支持

来自：
帮助文档
翼MapReduce
常见问题
产品咨询类
翼MR管理控制台和翼MR Manager页面区别与联系？
服务基础配置修改建议
本章节主要介绍服务的基础配置修改建议。核心原则：混部部署场景下的资源总量控制在翼 MR 集群中，多个大数据组件（如 HDFS、HBase、YARN 等）可能会部署在同一台 ECS 实例上（即混部场景）。为避免资源竞争导致系统不稳定，请遵循以下基本原则： · 总内存控制：所有组件 JVM 堆内存之和 ≤ 实例总内存 ×80%。预留至少 20% 的内存给操作系统、Page Cache、堆外内存及突发流量。 · CPU 资源控制：各组件线程池参数（如 Kafka 的num.io.threads等）配置之和不宜超过实例 vCPU 核数的 2~3 倍，避免过度竞争。 · YARN 资源隔离：若该节点同时运行 YARN NodeManager，其yarn.nodemanager.resource.memorymb配置不应超过实例总内存的 60%，以保证其他常驻组件的内存安全。说明以下各组件配置建议均基于独立部署场景给出。若您采用混部部署，请务必参照上述核心原则，适当调低各组件内存及线程参数。 Doris Doris 所在节点配置升级后，需根据实际内存和磁盘情况调整 FE 和 BE 配置。 FE（Frontend）配置建议 JVM 堆内存：修改fe.conf中的 JVM 参数。推荐使用 G1 垃圾回收器，堆内存初始与最大值保持一致。生产环境下建议按业务调整，最大不超过 100 GB 。示例：JAVAOPTS"Xms16g Xmx16g XX:+UseG1GC XX:MaxGCPauseMillis200" 日志路径：避免将日志放在系统目录。平台默认（翼 MR 版本 ≥ 2.21）会将日志放到数据目录下；低版本需手动修改fe.conf中的LOGDIR、syslogdir、auditlogdir为目标路径。请确保日志盘有至少 50 GB 空间。日志滚动数量：syslogrollnum（默认 10 个，每个 1 GB）、auditlogrollnum（默认 30 个，每个 1 GB），可根据需要调整。

来自：
帮助文档
翼MapReduce
用户指南
服务配置修改建议
服务基础配置修改建议
CLI使用
日志检索查询 plaintext Usage: ctlts log [command] Available Commands: getLogs Get logs from log service 日志下载管理 plaintext Usage: ctlts dataDownload [command] Available Commands: create Create download task delete Delete download task getSignUrl Get the download link for the specified download task list List download task query Get the download message for the specified download task. 服务开通管理 plaintext Usage: ctlts instance [command] Available Commands: checkLicense Check order instance status getInstanceInfo Get instance information under tenant resource pool getInstanceStatus Get instance status orderLogInstance Order cloud log service instance CLI命令执行示例 createProject ：创建日志项目 plaintext Usage: ctlts project createProject [flags] Examples: ctlts project createProject projectname [description ] [ak sk endpoint regionid or config ] Flags: d, description string log project description h, help help for createProject n, projectname string name of the project to create Global Flags: a, ak string accessid c, config string use config.yaml ,such as: confighuadong1 e, endpoint string endpoint i, regionid string regionid s, sk string accesskey 说明 Flages 中的 n, projectname string 代表可以使用project 或缩写n 来添加string 类型的字符串。 [description ] 这类方括号的代表是该参数不是openApi 的必须值，是可选的。 [ak sk endpoint regionid or config ] 代表可以使用命令注入四个参数，可以使用config配置文件注入，详情见全局配置。

来自：
帮助文档
云日志服务
API参考
日志服务CLI
CLI使用
AWS S3数据迁移到OOS
执行迁移对于 Windows 客户端，执行 import.bat 启动迁移。 1.打开开始菜单，搜索cmd，打开命令提示符窗口。 2.cd到压缩工具所在的目录下，例如 cd c:CTYUNOOSImport versionid 。 3.执行import.bat。对于Linux客户端，进入CTYUNOOSImport versionid ，执行命令./import.sh启动迁移。查看迁移状态迁移任务创建后，会生成相应日志记录迁移情况：迁移日志：migratelog文件夹下生成四种日志：异常日志、成功日志、跳过文件日志、其他日志。运行日志：在logs/migrate文件夹下，根据log4j2.xml配置可生成server.log、error.log、dubug.log等。默认未开启debug，不记录debug.log。您可通过日志查看迁移失败的文件，并且可以配置migrate.conf文件中的migrateLogFile参数实现对失败文件的再次迁移。说明数据迁移工具支持断点续传，如果迁移过程中程序被终止了，可以重新启动迁移任务，从之前中断的位置继续开始迁移。继续迁移的步骤如下： 1. 保留上次迁移执行过程中产生的backup文件。如果是在另外一台服务器上重新开始迁移任务，需要将backup文件拷贝到新服务器的迁移工具所在目录下。 2. （可选）查看nextMarker.txt文件中记录的上次数据迁移位置。修改migrate.conf，设置srcMarker为上次迁移位置，如果不修改，则可能会造成文件重复迁移。

来自：
帮助文档
对象存储（经典版）I型
最佳实践
数据迁移
AWS S3数据迁移到OOS
日志结构化配置
日志数据可分为结构化数据和非结构化数据。结构化数据指能够用数字或统一的数据模型加以描述的数据，具有严格的长度和格式。非结构化数据指不便于用数据库二维逻辑表来表现的数据，数据结构不规则或不完整，没有预定义的数据模型。日志结构化是以日志流为单位，通过不同的日志提取方式将日志流中的日志进行结构化，提取出有固定格式或者相似程度较高的日志，过滤掉不相关的日志。注意事项日志结构化是以日志流为单位，请先创建一个日志流。日志流中的大部分日志需有一定的规则，否则结构化是无意义的。结构化配置修改后，对新写入的日志数据生效，历史日志数据不会生效。创建结构化配置通过对日志流添加提取规则将日志流中的原始日志按一定的规律进行提取，并将提取后的日志整合到一起。下面详细介绍原始日志结构化的操作步骤： 1. 登录LTS控制台，在左侧导航栏中选择“日志管理”。 2. 结构化日志以日志流为单位，请在“日志管理”页面选择目标日志组和日志流。 3. 在日志流详情页面，单击右上角，在弹出页面中，选择“云端结构化解析”，进入日志结构化配置页面，选择对应的日志提取方法进行配置。正则分析 [JSON](

来自：
帮助文档
云日志服务
用户指南
日志搜索与分析
云端结构化解析
日志结构化配置
使用限制
分类对象使用限制仪表盘仪表盘 1个区域中最多可创建50个仪表盘。仪表盘仪表盘中的图表 1个仪表盘中最多可添加20个图表。仪表盘仪表盘中图表可选资源、阈值规则、组件或主机的个数 1个曲线图中最多可添加100个资源，且资源可跨集群选择。 1个数字图只能添加1个资源。 1个阈值状态图表最多可添加10个阈值规则。 1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。指标指标数据基础规格：指标数据最多保存7天。指标指标项资源（例如，集群、组件、主机等）被删除后，其关联的指标项在数据库中最多保存30天。指标维度每个指标的维度最多为20个。指标指标查询接口单次最大可同时查询20个指标。指标统计周期最大统计周期为1小时。指标单次查询返回指标数据单个指标单次查询最大返回1440个数据点。指标上报自定义指标单次请求数据最大不能超过40KB。指标应用指标 JOB指标每个主机的容器个数超过1000个时，ICAgent将停止采集该主机应用指标，并发送“ICAgent停止采集应用指标”告警（告警ID：34105）。每个主机的容器个数缩减到1000个以内时，ICAgent将恢复该主机应用指标采集，并清除“ICAgent停止采集应用指标”告警。由于JOB在完成任务之后，会自动退出。如果您需要监控JOB指标，要保证存活时间大于90秒才能采集到指标数据。指标采集器资源消耗采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关，在未运行任何业务的VM上，采集器将消耗30M内存、1% CPU。为保证采集可靠性，单节点上运行的容器个数应小于1000。阈值规则阈值规则一个项目下最多可创建1000个阈值规则。阈值规则发送通知可选择主题数每个阈值规则最多可选择5个主题。日志单条日志大小每条日志最大10KB，超出后ICAgent将不会采集该条日志，即该条日志会被丢弃日志日志流量每个租户在每个Region的日志流量不能超过10MB/s。如果超过10MB/s，则可能导致日志丢失。日志历史日志历史日志存储空间免费额度为500MB 日志日志文件只支持采集文本类型日志文件，不支持采集其他类型日志文件（例如二进制文件）。日志每个通过卷挂载日志的路径下，ICAgent最多采集20个日志文件。日志每个ICAgent最多采集1000个容器标准输出日志文件，容器标准输出日志只支持jsonfile类型。日志采集日志文件的资源消耗日志文件采集采集时消耗的资源和日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。日志日志丢失采集器使用多种机制保证日志采集的可靠性，尽可能保证数据不丢失，但在如下场景可能导致日志丢失。日志文件未使用CCE提供的logPolicy轮转策略。日志文件轮转速度过快，如1秒轮转一次。系统安全设置或syslog自身原因导致无法转发日志。容器运行时间过短，例如小于30s。单节点总日志产生速度过快，超过了单节点网络发送带宽或日志采集速度，建议单节点总日志产生速度<5M/s。日志日志丢弃当单行日志长度超过10240字节时，此行会被丢弃。日志日志重复当采集器被重启后，重启时间点附近可能会产生一定的数据重复。日志统计规则一个日志桶下最多可创建5条统计规则。告警中心告警您最多可查询最近30天的告警。告警中心事件您最多可查询最近30天的事件。

来自：
帮助文档
应用运维管理
产品简介
使用限制
Flink SQL作业相关问题
问题现象在DLI上提交Flink SQL作业，作业运行失败，在作业日志中有如下报错信息： connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null 问题根因该Flink SQL作业在配置作业运行参数时，有选择保存作业日志或开启Checkpoint，配置了OBS桶保存作业日志和Checkpoint。但是运行该Flink SQL作业的IAM用户没有OBS写入权限导致该问题。解决方案 1.登录IAM控制台页面，单击“用户”，在搜索框中选择“用户名”，输入运行作业的IAM用户名。 2.单击查询到用户名，查看该用户对应的用户组。 3.单击“用户组”，输入查询到的用户组查询，单击用户组名称，在“授权记录”中查看当前用户的权限。 4.确认当前用户所属用户组下的权限是否包含OBS写入的权限，比如“OBS OperateAccess”。如果没有OBS写入权限，则给对应的用户组进行授权。 5.授权完成后，等待5到10分钟等待权限生效。再次运行失败的Flink SQL作业，查看作业运行状态。 Flink SQL作业读取DIS数据报Not authorized错误问题现象 Flink SQL作业读取DIS数据，运行该作业时，语义校验失败。具体作业失败提示信息如下： Get dis channel xxx info failed. error info: Not authorized, please click the overview page to do the authorize action 问题原因运行Flink作业前，没有对运行的用户账号授权获取DIS数据的权限。解决方案 1.登录到DLI管理控制台，左侧导航栏选择“全局配置 > 服务授权”。 2.在服务授权管理界面，勾选“DIS Administrator”权限，单击“更新委托授权”完成对当前用户的DIS权限授权。 3.在“作业管理 > Flink作业”，单击对应的Flink SQL作业，重新启动和运行该作业。 Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据

来自：
帮助文档
数据湖探索
常见问题
操作类
Flink作业相关问题
Flink SQL作业相关问题
ALM-12050 网络写吞吐率超过阈值
检查阈值设置是否合理 1.在FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 > 网络写信息 > 写吞吐率”，查看该告警阈值是否合理（默认80%为合理值，用户可以根据自己的实际需求调节）。是，执行步骤4。否，执行步骤2。 2.根据实际服务的使用情况在“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 > 网络写信息 > 写吞吐率”，单击“操作”列的“修改”更改告警阈值。如下图所示： 3.等待5分钟，检查该告警是否恢复。是，处理完毕。否，执行步骤4。检查网口速率是否满足需求 4.打开FusionInsight Manager页面，在实时告警列表中，单击此告警所在行的，获取告警所在主机地址及网口。 5.以root用户登录告警所在主机。 6.执行命令ethtool 网口名称，查看当前网口速率最大值Speed。说明对于虚拟机环境，通过命令可能无法查询到网口速率，建议直接联系系统管理确认网口速率是否满足需求。 7.若网络写吞吐率超过阈值，直接联系系统管理员，提升网口速率。 8.检查该告警是否恢复。是，处理完毕。否，执行步骤9。收集故障信息 9.在主集群的FusionInsight Manager界面，选择“运维 > 日志 > 下载”。 10.在“服务”中勾选“OMS”，单击“确定”。 11.设置“主机”为告警所在节点和主OMS节点。 12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟，单击“下载”。 13.请联系运维人员，并发送已收集的故障日志信息。告警清除此告警修复后，系统会自动清除此告警，无需手工清除。参考信息无。

来自：
帮助文档
翼MapReduce
用户指南
FusionInsight Manager操作指导（适用于3.x）
告警参考（适用于MRS 3.x版本）
ALM-12050 网络写吞吐率超过阈值
ALM-12049 网络读吞吐率超过阈值
检查阈值设置是否合理 1.在FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 > 网络读信息 > 读吞吐率”，查看该告警阈值是否不合理（默认80%为合理值，用户可以根据自己的实际需求调节）。是，执行步骤2。否，执行步骤4。 2.根据实际服务的使用情况在“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 > 网络读信息 > 读吞吐率”，单击“操作”列的“修改”更改告警阈值。 3.等待5分钟，检查该告警是否恢复。是，处理完毕。否，执行步骤4。检查网口速率是否满足需求 4.打开FusionInsight Manager页面，在实时告警列表中，单击此告警所在行的，获取告警所在主机地址及网口名称。 5.以root用户登录告警所在主机。 6.执行命令ethtool 网口名称，查看当前网口速率最大值Speed。说明对于虚拟机环境，通过命令可能无法查询到网口速率，建议直接联系系统管理确认网口速率是否满足需求。 7.若网络读吞吐率超过阈值，直接联系系统管理员，提升网口速率。 8.检查该告警是否恢复。是，处理完毕。否，执行步骤9。收集故障信息 9.在主集群的FusionInsight Manager界面，选择“运维 > 日志 > 下载”。 10.在“服务”中勾选“OMS”，单击“确定”。 11.设置“主机”为告警所在节点和主OMS节点。 12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟，单击“下载”。 13.请联系运维人员，并发送已收集的故障日志信息。告警清除此告警修复后，系统会自动清除此告警，无需手工清除。参考信息无。

来自：
帮助文档
翼MapReduce
用户指南
FusionInsight Manager操作指导（适用于3.x）
告警参考（适用于MRS 3.x版本）
ALM-12049 网络读吞吐率超过阈值
图形审计
此小节介绍云堡垒机图形审计。可审计对象为授权的资产数据角色产生的图形访问会话，支持访问实时播放和回放、键盘记录、剪切板记录和中断会话。操作步骤 1.管理员登录并切换至“审计角色”，选择“会话日志 > 图形审计”。 2.单击“操作”列的“键盘”或“更多 > 剪切板”可查看记录。结束时间为空说明是活动会话，单击“播放”可实时观看会话，单击“中断”可中断该会话。

来自：
帮助文档
云堡垒机（原生版）
用户指南
管理员手册
会话日志
图形审计
产品类
本小节介绍安全专区产品类常见问题。安全专区相比传统安全组件有什么优势？与天翼云平台紧密集成，识别并管理云资产及安全状态；集成多种满足等保合规的安全组件，单点登录，一键登录并管理所有安全组件；提供全覆盖的安全态势管理能力，集中展现资产不同的安全状态信息；集中管理云网边界、虚机、业务系统的漏洞、告警、用户行为和安全运行数据；一键订购，产品自动交付，快速解决云上等保合规要求。安全专区的防护功能是否就能满足等保合规需求？安全专区可满足等保二级、三级的安全技术合规要求。一套安全专区的防护能服务于多少个系统？安全专区套餐可满足天翼云同个VPC甚至同数据节点的多个VPC的多个业务系统的安全防护要求；根据资产数量的不同，可配置不同的安全组件授权及虚机资源，满足业务防护性能需求。日志审计有没有整合在安全专区管理中心？有的，日志审计通过部署agent在主机进行管理。安全专区在多个VPC场景下，资产是否能共同管理？多个VPC的情况下，通过VPC路由器进行对等连接打通安全专区VPC，安全专区VPC各功能组件对所有资产共同统一管理。安全专区产品能否解耦订购？支持。安全专区防火墙防护流量最大能支持多少，如果客户所需流量超过最大防火墙防护流量怎么办？目前防火墙最大防护流量能达到1.6G，如果客户所需流量超过1.6G，要先确认客户有多少个VPC，如果客户有多个VPC，可以采用防火墙下沉到各个VPC分别管理的解决方案，这种情况也要结合具体项目情况具体沟通。

来自：
帮助文档
安全专区
常见问题
产品类
将MySQL同步到MySQL
参数描述数据流动方向选择“入云”，即目标端数据库为本云数据库。源数据库引擎选择“MySQL”。目标数据库引擎选择“MySQL”。网络类型此处以公网网络为示例。可根据业务场景选择公网网络、VPC网络和VPN、专线网络。目标数据库实例用户所创建的关系型数据库实例。说明目标数据库实例不支持选择只读实例。目标数据库实例可以和源数据库选择同一个实例。同步实例所在子网请选择同步实例所在的子网。也可以单击“查看子网”，跳转至“网络控制台”查看实例所在子网帮助选择。默认值为当前所选数据库实例所在子网，请选择有可用IP地址的子网。为确保同步实例创建成功，仅显示已经开启DHCP的子网。 IP类型选择迁移实例的IP类型，目前支持选择“IPv4”或“IPv4&IPv6双栈”。只有所选择的VPC及子网都开启了IPv6双栈功能，才能选择IP类型为“IPv4&IPv6双栈”。同步模式此处以“全量+增量”为示例。 “全量+增量”：该模式为数据持续性实时同步，通过全量过程完成目标端数据库的初始化后，增量同步阶段通过解析日志等技术，将源端和目标端数据保持数据持续一致。说明选择“全量+增量”同步模式，增量同步可以在全量同步完成的基础上实现数据的持续同步，无需中断业务，实现同步过程中源业务和数据库继续对外提供访问。 “增量”：增量同步通过解析日志等技术，将源端产生的增量数据同步至目标端。

来自：
帮助文档
数据库复制
用户指南
实时同步
入云
将MySQL同步到MySQL
xlog（WAL）堆积类问题
本页介绍天翼云TeleDB数据库xlog(WAL)堆积类问题。 xlog（WAL）堆积问题总体排查思路问题描述 xlog（WAL）堆积，明显超过预期大小，导致磁盘空间使用率上涨，甚至打满磁盘，影响实例运行。可能影响占用更多的磁盘空间；可能会打满磁盘，影响实例运行。解决步骤 1. 首先检查WAL和归档相关参数，核实参数是否符合预期； > 连接到WAL日志堆积的节点，执行以下SQL： > > select currentsetting('walkeepsegments') as walkeepsegments,(select count(1) > from pglsdir('./pgwal/')) as walcount; > WAL相关参数中，walkeepsegments为保留WAL日志文件的数量，通常实际统计的WAL日志文件数量比walkeepsegments稍多，相差几百内都属于正常范围，明显超出则确定WAL日志有堆积； 2. 检查WAL日志增长量是否符合预期； > 登录WAL日志堆积的节点所在服务器，进入pgwal目录，执行以下shell命令，按纬度统计WAL数量； > 统计每小时日志数量 > > ls lrt egrep [09AZ]{16}awk '{print $6" "$7" "$8}'awk F: '{print $1}'sort uniq c > 统计每天日志数量 > > ls lrt egrep [09AZ]{16}awk '{print $6" "$7}'awk F: '{print $1}'sort uniq c 3. 检查复制槽状态，是否有activefalse的复制槽； > 连接到WAL日志堆积的节点，执行以下SQL： > > select from pgreplicationslots where activefalse; > 如果有activefalse的复制槽，那么就会导致WAL堆积，需要核实并解决复制槽问题； 4. 如果不是复制槽问题，可以继续检查归档配置是否正确； > 连接到WAL日志堆积的节点，执行以下SQL： > > show archivestatuscontrol; > 如果参数查询结果为break，那么WAL日志文件不会被正常删除，需要核实并更正参数为continue； 5. 检查归档执行状态是否正常； > 登录WAL日志堆积的节点所在服务器，检查archiver进程状态是否正常，进程显示的last 归档的文件是否在更新。 > > ps fegrep archiver > 查询结果显示为archiver process failed on xxx，则说明归档败了，需要进一步排查归档失败原因； > 也可以执行以下SQL查询归档执行状： > > select from pgstatgetarchiver(); > 其中failedcount>0表示有归档失败。 6. 检查归档速度是否正常； > 如果归档正常，那需要检查归档速度是否正常，归档速度是否能赶上WAL日志生成的速度，如果归档速度比生成的慢，那么WAL日志会逐渐堆积起来，可以从减少WAL日志生成量和加快WAL日志文件归档两个方面入手进行优化； 7. 检查是否有长事务/长时间执行未结束的SQL； > 连接到WAL日志堆积的节点，执行以下SQL： > > select pid,clientaddr,statechange,querystart,statechange,EXTRACT(EPOCH FROM > (now()querystart)),query,state,usename,applicationname from pgstatactivity where > EXTRACT(EPOCH FROM (now()querystart))>600 and state!'idle'; > 如果有长时间执行未结束的SQL或事务，需要核实后清理掉，避免影响WAL日志文件的清理。 8. 如果影响业务，需要快速恢复，可以先手动清理，再定位原因； > 登录WAL日志堆积的节点所在服务器，进入pgwal/archivestatus目录，执行以下shell命令，修改.ready 的扩展名称.done > > find .ready sed 's/.ready$//' xargs I {} mv {}.ready {}.done > 或 > > ls lrt grep .ready awk F' ' '{print $NF}' xargs i rename ready done ./{} > 如果提示有太多的bash: /usr/bin/find: Argument list too long，则需要分批修改，具体前缀可以 top看一下 Arichve 进程当前在处理哪个WAL，然后取其前缀就行，例如： find 00000001000005[19].ready sed 's/.ready$//' xargs I {} mv {}.ready {}.done find 00000001000005[AF].ready sed 's/.ready$//' xargs I {} mv {}.ready {}.done

来自：
帮助文档
分布式融合数据库HTAP
私有云产品
故障处理
xlog（WAL）堆积类问题
Factory微调DeepSee
步骤二：微调DeepSeek模型 1. 启动LLaMAFactory服务在完成云主机开通后，即可通过ssh连接到到云主机命令行。模型及LLaMAFactory服务均已放置在/root目录下，且已完成配套环境安装，可直接运行。 plaintext 进入目录 cd /root/LLaMAFactory 启动webui服务 (也可通过nohup放到后台启动) llamafactorycli webui 在成功启动LLaMAFactory服务后，您将可以通过访问到相关页面。 plaintext 访问服务 2. 配置基础大模型和微调方法在成功进入LLaMAFactory页面后，您首先需要按照如图的内容进行页面语言，模型名称和模型路径的设置。注意注意模型预置在/root/DeepSeekR1DistillQwen7B目录下。 3. 配置微调数据集在Train页面内，您需要配置用于微调训练的数据集。镜像内预置了alpaca格式的天翼云示例数据，您也可参考示例数据修改/root/LLaMAFactory/data/目录下的alpacazhctyun.json(微调数据集)和datasetinfo.json(数据集信息)两个文件，改用您自己的私有数据。镜像内置两份数据集，单条内容示例如下： data/alpacazhctyun.json(天翼云文档数据集) plaintext { "instruction": "天翼云的通用型弹性云主机有哪些规格？", "input": "", "output": " 用户询问通用型云主机规格，首先需要明确通用型的定位是平衡计算和内存资源。根据产品文档，通用型以s7系列为代表，应当列举不同后缀规格及其配置差异，最后补充适用场景说明。 n通用型弹性云主机有多个规格，例如s7.small、s7.medium、s7.large、s7.xlarge等，每种规格提供不同的vCPU和内存配置，适合多种业务场景。" } data/alpacaenmedcalcbenchmax2k.json(医学计算数据集MedCalcBench) plaintext { "instruction": "A 16yearold female adolescent was referred to our hospital with severe hypertension (systolic pressure 178 mmHg), which was first detected 7 months prior to presentation during a routine annual physical ...", "input": "What is the patient's Creatinine Clearance using the CockroftGault Equation in terms of mL/min? You should use the patient's adjusted body weight in kg instead of the patient's actual body weight if the patient is ...", "output": " The formula for computing CockcroftGault is given by CrCl ((140 age) adjusted weight (gendercoefficient)) / (serum creatinine 72), where the gendercoefficient is 1 if male, and 0.85 if female..." } 4. 配置相关训练参数在Train页面内，还有大量可修改的微调训练参数。如果您对他们还不够了解，可暂时不进行修改。其中，训练轮数与样本量级关联性较大，如果您的微调数据量很少，则可能需要设置较大的训练轮数，才能有效果。 5. 启动微调训练点击最下方的开始按钮，即可基于上面选择的基础模型和微调数据集，启动模型微调训练。页面下方会显示实时的训练进度，训练日志和loss变化情况。如果您的训练样本较多，单张A10显卡的24G显存很容易因为无法承载，而导致报错"CUDA out of memory"。此时，您需要将云主机变配到显存更大的机型规格，并开启DeepSpeed stage3进行模型参数分片，如下图所示。同时，您还需要修改默认DeepSpeed配置中的部分参数，以保证训练正常进行。修改/root/LLaMAFactory/cache/dsz3config.json中的如下内容： plaintext "zerooptimization": { "stage": 3, "overlapcomm": true, "contiguousgradients": true, "subgroupsize": 1e9, "reducebucketsize": "auto", "stage3prefetchbucketsize": "auto", "stage3parampersistencethreshold": "auto", "stage3maxliveparameters": 1e4, //降低该参数以减少显存占用 "stage3maxreusedistance": 1e4, //降低该参数以减少显存占用 "stage3gather16bitweightsonmodelsave": true }

来自：
云容器集群节点网络丢包
3、配置全局策略 1. 在全局配置页面，按需添加保护策略和监控指标。 2. 配置完成后，单击完成按钮，创建演练任务。 4、发起故障注入 1. 发起演练：在演练管理列表找到对应演练任务，单击操作列的执行演练，在新页面中点击发起新演练。 2. 进入实验：系统将自动跳转到本次演练的运行详情页，或在演练执行记录列表点击对应执行实例的详情进入。 3. 注入故障：在动作组中，找到网络丢包动作卡片，单击执行。 4. 查看日志：单击动作卡片本身，在右侧弹出的侧边栏中查看执行详情。效果验证在故障注入期间，您可以通过以下方式验证演练效果： 1、观测实例指标：登录应用性能监控控制台，观测已接入应用的HTTP请求错误数、HTTP状态码统计指标 2、业务应用验证：观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时，是否出现响应延迟增加或请求超时。对于依赖 UDP 的服务（如DNS查询、部分音视频流），确认是否出现了功能异常或数据丢失。检查应用日志，确认是否有因超时或重传而产生的错误。确认 Kubernetes 的 liveness/readiness 探针是否因丢包而探测失败，导致 Pod 被重启。

来自：
帮助文档
应用高可用
用户指南
故障演练服务
故障动作库
云容器
云容器引擎
云容器集群节点网络丢包
云容器集群节点网络丢包(1)
3、配置全局策略 1. 在全局配置页面，按需添加保护策略和监控指标。 2. 配置完成后，单击完成按钮，创建演练任务。 4、发起故障注入 1. 发起演练：在演练管理列表找到对应演练任务，单击操作列的执行演练，在新页面中点击发起新演练。 2. 进入实验：系统将自动跳转到本次演练的运行详情页，或在演练执行记录列表点击对应执行实例的详情进入。 3. 注入故障：在动作组中，找到网络丢包动作卡片，单击执行。 4. 查看日志：单击动作卡片本身，在右侧弹出的侧边栏中查看执行详情。效果验证在故障注入期间，您可以通过以下方式验证演练效果： 1、观测实例指标：登录应用性能监控控制台，观测已接入应用的HTTP请求错误数、HTTP状态码统计指标 2、业务应用验证：观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时，是否出现响应延迟增加或请求超时。对于依赖 UDP 的服务（如DNS查询、部分音视频流），确认是否出现了功能异常或数据丢失。检查应用日志，确认是否有因超时或重传而产生的错误。确认 Kubernetes 的 liveness/readiness 探针是否因丢包而探测失败，导致 Pod 被重启。

来自：

天翼云最新活动

云聚517 · 好价翼起拼

爆款云主机低至25.83元/年，参与拼团享更多优惠，拼成得额外优惠券

安全隔离版OpenClaw

OpenClaw云服务器专属“龙虾“套餐低至1.5折起

聚力AI赋能天翼云大模型专项

大模型特惠专区·Token Plan 轻享包低至9.9元起

青云志云端助力计划

一站式科研助手，海外资源安全访问平台，助力青年翼展宏图，平步青云

企业出海解决方案

助力您的业务扬帆出海，通达全球！

天翼云信创专区

“一云多芯、一云多态”,国产化软件全面适配，国产操作系统及硬件芯片支持丰富

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

天翼云最新活动

产品推荐

多活容灾服务 MDR

轻量型云主机

AI Store

公共算力服务

一站式智算服务平台

知识库问答

人脸活体检测

身份证识别

驾驶证识别

推荐文档

天翼云进阶之路③：top使用方法

Microsoft SQL Server