活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 一键部署Llama3大模型学习机 0代码一键部署,预装最新主流大模型Llama3与StableDiffusion
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心

      查看所有产品

      数据治理中心 DataArts Studio

      数据治理中心 DataArts Studio

        • 产品动态
        • 产品简介
        • 产品定义
        • 产品优势
        • 功能特性
        • 应用场景
        • 术语解释
        • 权限管理
        • 权限列表
        • 约束与限制
        • 数据治理中心DataArts Studio与其他服务的关系
        • 计费说明
        • 资源节点
        • 产品规格
        • 产品价格
        • 计费模式
        • 购买
        • 变更
        • 续订
        • 退订
        • 准备工作
        • 准备工作简介
        • 创建DataArts Studio实例
        • 创建DataArts Studio基础包
        • (可选)创建DataArts Studio增量包
        • 访问DataArts Studio实例控制台
        • 管理工作空间
        • 创建并管理工作空间
        • (可选)修改作业日志存储路径
        • 授权用户使用DataArts Studio
        • 创建IAM用户并授予DataArts Studio权限
        • (可选)自定义工作空间角色
        • 添加工作空间成员和角色
        • (可选)获取认证信息
        • 用户指南
        • 使用DataArts Studio前的准备
        • 管理控制台
        • 创建数据连接
        • 资源迁移
        • 使用教程
        • 新建MRS Hive连接
        • 新建DWS连接
        • 新建MySQL连接
        • DataArts Studio支持的数据源
        • 数据集成
        • 数据集成概述
        • 约束与限制
        • 支持的数据源
        • 管理集群
        • 创建CDM集群
        • 解绑/绑定集群的EIP
        • 重启集群
        • 删除集群
        • 下载集群日志
        • 查看集群基本信息/修改集群配置
        • 监控指标
        • 支持的监控指标
        • 设置告警规则
        • 查看监控指标
        • 管理连接
        • 新建连接
        • 管理驱动
        • 管理Agent
        • 管理集群配置
        • 配置常见关系数据库连接
        • 配置分库连接
        • 配置MySQL数据库连接
        • 配置Oracle数据库连接
        • 配置DLI连接
        • 配置Hive连接
        • 配置HBase连接
        • 配置HDFS连接
        • 配置OBS连接
        • 配置FTP/SFTP连接
        • 配置Redis/DCS连接
        • 配置DDS连接
        • 配置CloudTable连接
        • 配置CloudTable OpenTSDB连接
        • 配置MongoDB连接
        • 配置Cassandra连接
        • 配置Kafka连接
        • 配置DMS Kafka连接
        • 配置Elasticsearch/云搜索服务(CSS)连接
        • 管理作业
        • 新建表/文件迁移作业
        • 新建整库迁移作业
        • 配置作业源端参数
        • 配置OBS源端参数
        • 配置HDFS源端参数
        • 配置HBase/CloudTable源端参数
        • 配置Hive源端参数
        • 配置DLI源端参数
        • 配置FTP/SFTP源端参数
        • 配置HTTP源端参数
        • 配置常见关系数据库源端参数
        • 配置MySQL源端参数
        • 配置Oracle源端参数
        • 配置分库源端参数
        • 配置MongoDB/DDS源端参数
        • 配置Redis源端参数
        • 配置Kafka/DMS Kafka源端参数
        • 配置Elasticsearch或云搜索服务源端参数
        • 配置OpenTSDB源端参数
        • 配置作业目的端参数
        • 配置OBS目的端参数
        • 配置HDFS目的端参数
        • 配置HBase/CloudTable目的端参数
        • 配置Hive目的端参数
        • 配置常见关系数据库目的端参数
        • 配置DWS目的端参数
        • 配置DDS目的端参数
        • 配置DCS目的端参数
        • 配置云搜索服务目的端参数
        • 配置DLI目的端参数
        • 配置OpenTSDB目的端参数
        • 配置定时任务
        • 作业配置管理
        • 管理单个作业
        • 批量管理作业
        • 审计
        • 支持云审计的关键操作
        • 如何查看审计日志
        • 使用教程
        • 创建MRS Hive连接器
        • 创建MySQL连接器
        • MySQL数据迁移到MRS Hive分区表
        • MySQL数据迁移到OBS
        • MySQL数据迁移到DWS
        • MySQL整库迁移到RDS服务
        • Oracle数据迁移到云搜索服务
        • Oracle数据迁移到DWS
        • OBS数据迁移到云搜索服务
        • OBS数据迁移到DLI服务
        • MRS HDFS数据迁移到OBS
        • Elasticsearch整库迁移到云搜索服务
        • DDS数据迁移到DWS
        • 进阶实践
        • 增量迁移原理介绍
        • 文件增量迁移
        • 关系数据库增量迁移
        • 时间宏变量使用解析
        • HBase/CloudTable增量迁移
        • 事务模式迁移
        • 迁移文件时加解密
        • MD5校验文件一致性
        • 字段转换
        • 指定文件名迁移
        • 正则表达式分隔半结构化文本
        • 记录数据迁移入库时间
        • 文件格式介绍
        • 数据架构
        • 数据架构概述
        • 数据架构使用流程
        • 准备工作
        • 添加审核人
        • 管理配置中心
        • 数据调研
        • 流程设计
        • 主题设计
        • 标准设计
        • 新建码表
        • 新建数据标准
        • 模型设计
        • 关系建模
        • 逻辑模型设计
        • 物理模型设计
        • 维度建模
        • 新建维度
        • 管理维度表
        • 新建事实表
        • 指标设计
        • 业务指标
        • 技术指标
        • 新建原子指标
        • 新建衍生指标
        • 新建复合指标
        • 新建时间限定
        • 数据集市建设
        • 新建汇总表
        • 通用操作
        • 逆向数据库(关系建模)
        • 逆向数据库(维度建模)
        • 导入导出表
        • 关联质量规则
        • 查看表
        • 批量修改主题/目录/流程
        • 审核中心
        • 使用教程
        • 数据架构示例
        • 数据开发
        • 数据开发概述
        • 数据管理
        • 数据管理流程
        • 新建数据连接
        • 新建数据库
        • (可选)新建数据库模式
        • 新建数据表
        • 脚本开发
        • 脚本开发流程
        • 新建脚本
        • 开发脚本
        • 开发SQL脚本
        • 开发Shell脚本
        • 开发Python脚本
        • 提交版本并解锁
        • (可选)管理脚本
        • 复制脚本
        • 复制名称与重命名脚本
        • 移动脚本/脚本目录
        • 导出导入脚本
        • 查看脚本引用
        • 删除脚本
        • 迁移脚本责任人
        • 批量解锁
        • 作业开发
        • 作业开发流程
        • 新建作业
        • 开发作业
        • 调度作业
        • 提交版本并解锁
        • (可选)管理作业
        • 复制作业
        • 复制名称和重命名作业
        • 移动作业/作业目录
        • 导出导入作业
        • 删除作业
        • 迁移作业责任人
        • 批量解锁
        • 解决方案
        • 运行历史
        • 运维调度
        • 运维概览
        • 作业监控
        • 批作业监控
        • 实时作业监控
        • 实例监控
        • 补数据监控
        • 通知管理
        • 管理通知
        • 通知周期概览
        • 备份管理
        • 配置管理
        • 配置
        • 配置环境变量
        • 配置OBS桶
        • 管理作业标签
        • 配置委托
        • 配置默认项
        • 管理资源
        • 节点参考
        • 节点概述
        • 节点数据血缘
        • 方案概述
        • 配置数据血缘
        • 查看数据血缘
        • CDM Job
        • Rest Client
        • Import GES
        • MRS Kafka
        • Kafka Client
        • ROMA FDI Job
        • DLI Flink Job
        • DLI SQL
        • DLI Spark
        • DWS SQL
        • MRS Spark SQL
        • MRS Hive SQL
        • MRS Presto SQL
        • MRS Spark
        • MRS Spark Python
        • MRS Flink Job
        • MRS MapReduce
        • CSS
        • Shell
        • RDS SQL
        • ETL Job
        • Python
        • Create OBS
        • Delete OBS
        • OBS Manager
        • Open/Close Resource
        • Data Quality Monitor
        • Sub Job
        • For Each
        • Dummy
        • EL表达式参考
        • 表达式概述
        • 基础操作符
        • 日期和时间模式
        • Env内嵌对象
        • Job内嵌对象
        • StringUtil内嵌对象
        • DateUtil内嵌对象
        • JSONUtil内嵌对象
        • Loop内嵌对象
        • OBSUtil内嵌对象
        • 表达式使用示例
        • 使用教程
        • 作业依赖详解
        • IF条件判断教程
        • 获取Rest Client算子返回值教程
        • For Each算子使用介绍
        • 开发一个Python脚本
        • 开发一个DWS SQL作业
        • 开发一个Hive SQL作业
        • 开发一个DLI Spark作业
        • 开发一个MRS Flink作业
        • 开发一个MRS Spark Python作业
        • 数据质量
        • 业务指标监控
        • 业务指标监控概述
        • 新建指标
        • 新建规则
        • 新建业务场景
        • 查看业务场景实例
        • 数据质量监控
        • 数据质量监控概述
        • 新建规则模板
        • 新建质量作业
        • 新建对账作业
        • 查看规则实例
        • 查看质量报告
        • 使用教程
        • 新建一个业务场景
        • 新建一个质量作业
        • 新建一个作业对账实例
        • 数据目录
        • 数据地图
        • 简介
        • 资产总览
        • 数据目录
        • 标签管理
        • 数据权限
        • 数据权限简介
        • 数据目录权限
        • 数据表权限
        • 审批中心
        • 数据安全(待下线)
        • 数据安全简介
        • 数据密级
        • 数据分类
        • 脱敏策略
        • 元数据采集
        • 元数据简介
        • 任务管理
        • 任务监控
        • 使用教程
        • 开发一个增量元数据采集任务
        • 通过数据地图查看数据血缘关系
        • 方案概述
        • 配置数据血缘
        • 查看数据血缘
        • 数据服务
        • 数据服务概览
        • 规格说明
        • 开发API
        • 准备工作
        • 创建专享版集群
        • 新建审核人
        • 创建API
        • 配置模式生成API
        • 脚本模式生成API
        • 注册API
        • 调试API
        • 发布API
        • 管理API
        • 设置API可见
        • 停用/恢复API
        • 下线/删除API
        • 复制API
        • 全量导出/导出/导入API
        • 流量控制
        • 调用API
        • 审核中心操作说明
        • 常见问题
        • 计费类
        • 购买类
        • 操作类
        • 管理中心
        • 数据集成
        • 数据架构
        • 数据开发
        • 数据质量
        • 数据目录
        • 数据服务
        • 相关协议
        • 数据治理中心 DataArts Studio产品服务协议
        • 数据治理中心 DataArts Studio产品服务等级协议
        • 文档下载
        • 数据治理中心 DataArts Studio用户操作指南
        • 数据治理中心 DataArts Studio故障排除
          无相关产品

          本页目录

          帮助中心 数据治理中心 DataArts Studio 用户指南 数据质量 数据质量监控 新建质量作业
          新建质量作业
          更新时间 2023-08-17 17:18:29
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2023-08-17 17:18:29
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本章节主要介绍新建质量作业的操作。

          质量作业可将创建的规则应用到建好的表中进行质量监控。

          前提条件

          在DataArts Studio控制台数据质量模块,“数据质量监控 > 质量作业”页面创建归属目录。基于某个数据连接创建质量作业,需要选择作业归属目录,请参见下图创建归属目录。

          新建质量作业的归属目录

          图3-559 新建质量作业的归属目录.jpg

          下表是导航栏按键说明

          序号 说明
          1 新建目录。
          2 刷新目录。
          3 选择目录,单击右键,可新建目录、删除目录和对目录重命名。

          配置流程

          1. 在DataArts Studio控制台首页,选择实例,点击“进入控制台”,选择对应工作空间的“数据质量”模块,进入数据质量页面。

          详见下图:选择数据质量

          图3-560 选择数据质量.png

          1. 选择“数据质量监控 > 质量作业”。
          2. 单击“新建”,在弹出的对话框中,参见下表配置相关参数。
          序号 说明
          1 新建目录。
          2 刷新目录。
          3 选择目录,单击右键,可新建目录、删除目录和对目录重命名。
          1. 单击“下一步”,进入规则配置页面。您需要点击规则卡片中的放大.png,然后参见下表配置数据质量规则。默认规则配置完成后,您也可选择继续添加更多的质量规则,创建完成后单击下一步,即可将创建的所有规则应用到已建好的库或表中。

          详见下图:打开质量作业规则配置

          图3-561 打开质量作业规则配置.png

          下表是配置模板规则

          添加方式 配置 说明
          基本信息 子作业名称 在作业的执行结果中,每条规则对应一个子作业。为便于结果查看和日志定位,建议您补充子作业信息。
          基本信息 描述 为更好的识别子作业,此处加以描述信息。
          来源对象 规则类型 包括库级规则、表级规则、字段级规则、跨字段级规则和自定义规则,自定义规则可针对表中的具体字段配置监控规则。
          来源对象 数据连接 来源对象/目的对象支持的数据源类型:DWS,MRS Hive,DLI,ORACLE、RDS(MySQL、PostgreSQL)。
          从下拉列表中选择已创建的数据连接。
          说明
          规则都是基于数据连接的,所以在建立数据质量规则之前需要先到管理中心模块中建立数据连接。
          针对通过代理连接的MRS HIVE,需要选择MRS API方式或者代理方式提交:
          MRS API方式:通过MRS API的方式提交。历史作业默认是MRS API提交,编辑作业时建议不修改。
          代理方式:通过用户名、密码访问的方式提交。新建作业建议选择代理提交,可以避免权限问题导致的作业提交失败。
          来源对象 数据库 选择配置的数据质量规则所应用到的数据库。
          说明
          数据库基于已建立的数据连接。
          当“规则类型”选择“库级规则”,数据对象选择对应的数据库即可。
          来源对象来源对象 数据表 选择配置的数据质量规则所应用到的表。
          说明
          数据表与数据库强相关,基于已选择的数据库。
          当“规则类型”选择“表级规则”,数据对象选择对应的数据表。
          来源对象 SQL 当“规则类型”选择“自定义规则”时,需要配置该参数。此处需输入完整的SQL语句,定义如何对数据对象进行数据质量监控。
          来源对象 失败策略 选择是否勾选“忽略规则错误”。
          来源对象 选择字段 当“规则类型”选择“字段级规则”,需要配置该参数。此处选择对应数据表中的字段。
          说明
          数据质量字段级别校验不支持对字段名为单个字母(例如:a,b,c,d...等)的字段进行校验。
          来源对象 参考数据对象 当“规则类型”选择“跨字段级规则”,需要配置该参数。此处选择参考的数据字段。
          来源对象 维度 当“规则类型”选择“自定义规则”时,需要配置该参数。将该自定义规则与质量六性(完整性、有效性、及时性、一致性、准确性、唯一性)进行关联。
          计算引擎 集群名称 选择运行质量作业的引擎。仅数据连接为DLI类型时,此参数有效。
          规则模板 模板名称 选择系统内置的或者用户自定义的规则模板。
          说明
          模板类型与规则类型强相关,详情请参见新建规则模板章节中的 系统内置的规则模板一览表。除去系统内置规则模板外,您也可关联在新建规则模板中新建的自定义模板。
          规则模板 版本 仅“模板名称”选择为自定义的规则模板时,需要配置该参数。自定义的规则模板发布后,会产生对应的版本号,此处选择所需的版本。
          规则模板 权重 设置规则的权重,支持按照字段级别设置权重。权重范围:【1-9】,整数。默认值为5。
          计算范围 选择扫描区域 支持选择“全表扫描”或“条件扫描”,默认为全表扫描。
          当仅需计算一部分数据,或需周期性按时间戳运行质量作业时,建议通过设置where条件进行条件扫描。
          计算范围 where条件 输入where子句,系统会选择符合条件的数据进行扫描。
          例如需要筛选数据表中“age”字段在(18, 60]区间范围内的数据时,where条件可设置为如下内容:age > 18 and age <= 60
          where条件还支持输入为SQL动态表达式,例如当需要根据“time”字段筛选数据表中24小时前的数据时,where条件可设置为如下内容: time >= (date_trunc('hour', now()) - interval '24 h') and time <= (date_trunc('hour', now()))
          告警条件 告警表达式 此参数可选,如果您需要针对当前规则设定告警条件,则可以在此配置告警条件的表达式。如果您需要通过多条规则的逻辑运算统一设置告警条件的表达式,此处无需设置,可在下一步的告警配置中统一设置。
          配置规则的告警条件后,系统通过“告警参数”的值,结合告警条件进行真假判断,如果结果为真则进行告警。另外,除了单一告警表达式的结果,您还可以通过逻辑运算符组成组成更复杂的告警条件进行告警。当前表达式中支持如下逻辑运算符,且可以通过“(”和“)”进行包围:
          +:相加
          -:相减
          *:相乘
          /:相除
          ==:等于
          !=:不等于
          >:大于
          <:小于
          >=:大于等于
          <=:小于等于
          !:非
          ll:或
          &&:与
          例如,“规则模板”为“字段空值”时,您可以参考如下样例进行配置:
          需要配置字段空值大于10时告警,则此处可设置为“image.png{1}>10”,其中“image.png{1}”为通过告警参数配置的“空值行数”。
          需要配置有字段空值率大于80%时告警,则此处可设置为“image.png{3}>0.8”,其中“image.png{3}”为通过告警参数配置的“空值率”。
          需要配置字段空值大于10或字段空值率大于80%时告警,则此处可设置为“(image.png{1}>10)ll (image.png{3}>0.8)”,其中“image.png{1}”和“image.png{3}”分别为通过告警参数配置的“空值行数”和“空值率”,“ll”表示满足两个条件之一即会告警。
          告警条件 告警参数 此参数来源于规则模板的输出结果。您可以单击界面显示的参数从而输入告警表达式中的告警参数,单击后系统会在“告警表达式”输入框给出参数的表达式。
          例如“规则模板”为“字段空值”时,点击告警参数“空值行数”,在“告警表达式”输入框会显示为“${1}”。
          告警条件 逻辑运算符 可选,本参数支持将单一告警表达式的结果进行逻辑运算,组成更复杂的告警条件。
          您可以将鼠标光标放在“告警表达式”输入框处需要进行逻辑运算的两个告警表达式之间,然后单击输入如下之一运算符。另外,您也可以手动输入,当前表达式中支持如下逻辑运算符,且可以通过“(”和“)”进行包围:
          +:相加
          -:相减
          *:相乘
          /:相除
          ==:等于
          !=:不等于
          >:大于
          <:小于
          >=:大于等于
          <=:小于等于
          !:非
          ll:或
          &&:与
          例如,“规则模板”为“字段空值”,需要配置字段空值大于10或字段空值率大于80%时告警,则“告警表达式”可设置为“(image.png{1}>10)ll (image.png{3}>0.8)”,其中“image.png{1}”和“image.png{3}”分别为通过告警参数配置的“空值行数”和“空值率”,“ll”表示满足两个条件之一即会告警。
          告警条件 质量评分 当“规则类型”选择“自定义规则”时,需要配置该参数。
          告警条件 生成异常数据 开启“生成异常数据”开关,单击“选择库表”可将质量作业中不符合设定规则的异常数据存储在异常表中。
          说明
          自定义模板不支持生成异常数据,自定义规则可通过自定义异常表SQL生成异常数据。
          系统内置模板,“表级规则”中的“表行数”模板。“字段级规则”中的“字段平均值”、“字段汇总值”、“字段最大值”、“字段最小值”模板不支持生成异常数据。
          当质量作业设置周期调度或重跑时,每次实例运行的扫描的异常数据会持续插入该异常表。建议您定期到该数据湖中清理异常表数据,避免异常数据表超大带来的成本与性能问题。
          告警条件 异常表 单击选择库表,可以配置输出表名的前后缀。
          告警条件 输出配置 输出规则配置:勾选,则可在异常表中显示质量作业的配置信息,方便查看异常数据产生的源头。
          输出空值:勾选,则当空值不满足设定规则时,可在异常表中输出空值。
          告警条件 异常数据数量 可选择输出全部的异常数据,或者设定数量的异常数据。
          告警条件 异常表SQL 当“规则类型”选择“自定义规则”时,需要配置该参数。此处需输入完整的SQL语句,指定输出哪些数据是异常数据。
          告警条件 查看相同规则 单击,创建质量作业时,
          能够根据表和字段判断规则的重复性。
          提示已存在相关子规则和质量作业,您可看到已有规则。
          计算范围 选择扫描区域 用来确定所配置的某条规则应检查的范围。
          勾选全表扫描,则遍历所有表。
          勾选条件扫描,输入where条件后,精确定位分区查询数据,不需要全表扫描查询。
          1. 单击“下一步”,设置告警配置信息。如果您在上一步的规则配置中已配置告警表达式,此处会自动带出已配置的表达式;如果未配置,则您可在此进行配置。多条(2条及以上)子规则时,则可以选择如下两种告警配置方式之一进行配置:

          a.支持通过子规则的告警条件,分别上报告警。

          b.将子规则之间的告警参数值通过数学运算和逻辑运算,设置一个统一的告警条件表达式来表示作业是否告警。

          当前表达式中支持如下逻辑运算符,且可以通过“(”和“)”进行包围:

          − +:相加

          − -:相减

          − *:相乘

          − /:相除

          − ==:等于

          − !=:不等于

          − >:大于

          − <:小于

          − >=:大于等于

          − <=:小于等于

          − !:非

          − ||:或

          − &&:与

          1. 单击“下一步”,设置订阅配置信息,如果需要接收SMN通知,打开通知状态,选择通知类型和SMN服务主体。
          2. 单击“下一步”,选择调度方式,支持单次调度和周期调度两种方式,周期调度的相关参数配置请参见表下表。配置完成后单击“提交”。
          说明
          1. 单次调度会产生手动任务的实例,手动任务的特点是没有调度依赖,只需要手动触发即可。

          2. 周期调度会产生周期实例,周期实例是周期任务达到启用调度所配置的周期性运行时间时,被自动调度起来的实例快照。

          3. 周期任务每调度一次,便生成一个实例工作流。您可以对已调度起的实例任务进行日常的运维管理,如查看运行状态,对任务进行终止、重跑等操作。

          4. 只有支持委托提交作业的MRS集群,才支持质量作业周期调度。支持委托方式提交作业的MRS集群有:

          • MRS的非安全集群。

          • MRS的安全集群,集群版本大于 2.1.0,并且安装了MRS 2.1.0.1以上的补丁。

          下表是配置周期调度参数

          参数名 说明
          生效日期 调度任务的生效日期。
          调度周期 选择调度任务的执行周期,并配置相关参数。
          -分钟
          -小时
          -天
          -周
          说明
          调度周期选择分钟/小时,需配置调度的开始时间、间隔时间和结束时间。开始时间目前支持设置到分钟级别,进行错峰调度。
          调度周期选择天,需要配置调度时间,即确定了调度任务于每天的几时几分启用。
          调度周期选择周,需要配置生效时间和调度时间,即确定了调度任务于周几的几时几分启用。

          导出质量作业

          系统支持批量导出质量作业,一次最多可导出200个质量作业。

          1. 选择“数据质量监控 > 质量作业”,选择要导出的质量作业。
          2. 单击“导出”,弹出“导出质量作业”对话框。
          3. 单击“导出”,切换到“导出记录”页签。
          4. 在导出文件列表中,单击最新导出文件对应的“下载”,可将质量作业的Excel表格下载到本地。

          导入质量作业

          系统支持批量导入质量作业,一次最大可导入1M数据的文件,并且最多200个质量作业。

          1. 选择“数据质量监控 > 质量作业”,单击“导入”,弹出“导入质量作业”对话框。

          1.png

          1. 在“导入配置”页签,选择模板名称重名策略。
          • 终止:如果质量作业名称有重复,则全部导入失败。
          • 跳过:如果质量作业名称有重复,会忽略后继续导入。
          • 覆盖:如果质量作业名称有重复,会覆盖现有同名作业。
          1. 单击“上传文件”,选择准备好的数据文件。
          说明

          可通过如下两种方式填写数据文件:

          • (推荐使用)通过“导出”功能,可将数据直接/或修改后批量导入系统。

          • 通过“下载Excel模板”,将数据填写好,再导入至系统中。

          1. 分别配置数据连接、集群、目录、主题的映射资源信息。

          2.png

          • 数据连接:选择导入后的数据连接类型。
          • 集群:如果数据连接类型是DLI,需要选择对应的队列。
          • 目录:选择导入后的质量作业存储目录。
          • 主题:如果配置了消息通知,需要选择主题。
          1. 单击“导入”,将填好的Excel表格模板导入到系统。
          2. 单击“导入记录”页签,可查看对应的导入记录。
          上一篇 :  新建规则模板
          下一篇 :  新建对账作业
          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

           文本反馈
          搜索
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明