活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      大数据管理平台 DataWings

      大数据管理平台 DataWings

        • 产品动态
        • 产品介绍
        • 产品定义
        • 产品优势
        • 应用场景
        • 核心能力
        • 计费说明
        • 产品规格
        • 计费模式
        • 公测申请
        • 续订/退订
        • 快速入门
        • 客户控制台
        • 创建集群
        • 引擎配置
        • 创建数据源
        • 添加库表HDFS权限
        • 用户指南
        • 首页
        • 数据源
        • 数据源概述
        • 数据源管理
        • 数据建模
        • 数据建模概述
        • 建模首页
        • 数据标准
        • 命名词典
        • 字段标准
        • 标准值域
        • 度量单位
        • 规范管理
        • 标准配置
        • 数仓规划
        • 业务分类
        • 数仓分层
        • 规划配置
        • 数仓要素
        • 数据指标
        • 原子指标
        • 业务限定
        • 统计周期
        • 维度
        • 派生指标
        • 复合指标
        • 规范建模
        • 维度建模
        • 可视化建模
        • 可视化建模概述
        • 新建接入表
        • 新建维度表
        • 新建事实表
        • 新建汇总表
        • 新建应用表
        • 新建其他表
        • 导入方式建模
        • 管理表模型
        • 查看表详情
        • 逆向建模
        • 数据集成
        • 数据集成概述
        • 集成集群管理
        • 资源组
        • 集群注册
        • 同步任务
        • 任务创建
        • 任务管理
        • 数据处理
        • 数据开发
        • 项目管理
        • 工作流开发
        • 工作流模板
        • 工作流发布
        • 数据开发节点介绍
        • SparkSQL节点
        • 数据质量节点
        • 通用处理节点
        • 任务依赖节点
        • 任务调度
        • 调度大屏
        • 任务运维
        • 资源组监控
        • 基线管理
        • 即席查询
        • 用户空间
        • 数据库
        • 配置中心
        • 数据治理
        • 数据调研
        • 数据质量
        • 数据质量概述
        • 数据质量大屏
        • 规则管理
        • 数据质量规则列表
        • 创建数据质量规则
        • 试运行质量规则
        • 模板管理
        • 实例管理
        • 抑制管理
        • 质检报告
        • 数据质量分析
        • 数据治理360
        • 数据治理360概述
        • 开启使用
        • 健康诊断
        • 治理项问题
        • 治理项配置
        • 健康指南
        • 白名单
        • 数据地图
        • 数据地图概述
        • 数据发现
        • 地图配置
        • 资产首页
        • 数据总览
        • 数据检索
        • 我的数据
        • 元数据管理
        • 数据服务
        • 数据服务概述
        • 服务开发
        • 服务管理
        • 服务监控
        • 服务配置
        • 运维中心
        • 告警管理
        • 通道及对象管理
        • 告警实例
        • 值班表
        • 资源运维
        • 监控规则管理
        • 操作日志
        • 系统管理
        • 权限管理
        • 角色管理
        • 用户管理
        • 集群管理
        • 集群注册
        • 引擎管理
        • 流程中心
        • 我的申请
        • 我的审批
        • 我的导入
        • 权限申请
        • 消息中心
        • 最佳实践
        • 获取翼MapReduce数据湖集群信息
        • 电商行业数据建模实践
        • 常见问题
        • 常见产品问题
        • 购买类
        • 计费类
        • 文档下载
        • 大数据管理平台 DataWings用户手册
        • 视频专区
        • 相关协议
        • 大数据管理平台 DataWings公测服务协议
        • API参考
        • API
        • 2024-11-05 版本
        • 获取所有数据源的信息
        • 获取数据源插件和类型列表
        • 获取所有数据库的信息
          无相关产品

          本页目录

          帮助中心大数据管理平台 DataWings用户指南数据治理数据质量规则管理创建数据质量规则
          创建数据质量规则
          更新时间 2025-02-28 14:03:16
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2025-02-28 14:03:16
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本节为您介绍如何创建数据质量规则。

          使用限制

          • 当前数据质量规则仅支持内置Hive、内置Doris数据源和Mysql数据源。
          • 创建数据质量规则后,您需要在数据开发 > 工作流开发中创建数据质量节点才可以周期调度。
          • 部分数据质量规则模板需要先维护数据标准(标准值域、数据格式等),若您购买的版本不包含数据建模模块,对应的规则模板也无法使用。

          步骤

          1. 点击数据治理 > 数据质量 > 质量规则 > 规则管理进入数据质量规则列表页。
          2. 点击【新建规则】,即可创建配置数据质量规则。

          创建分区表达式

          大数据场景下,为避免全表扫描,提升任务执行效率,数据质量基于分区表达式来创建管理数据质量规则,用于稽核校验指定分区的数据质量,配置规则前,您可以点击管理分区表达式来创建或者删除分区表达式。

          image.png

          DataWings为您提供了部分内置的分区表达式,可直接使用,若内置表达式无法满足您的需要,则可根据需要输入自定义表达式。

          配置分区表达式后,点击【计算】 ,数据质量会以当前时间作为调度时间,计算出分区表达式的实际结果,用来验证分区表达式是否符合您的预期。

          内置分区表达式及其解释

          分区表达式 解释
          dt=$[yyyyMMdd] 表示分区时间取调度时间当天。
          dt=$[yyyyMMdd-1d] 表示分区时间取调度时间前一天。
          dt=$[yyyyMMdd-1M] 表示分区时间取调度时间前一月。
          dt=$[yyyyMMddHHmmss] 表示分区时间取调度时间(秒)。
          dt=$[yyyyMMddHHmmss-1d] 表示分区时间取调度时间前一天(秒)。
          dt=$[yyyyMMddHHmmss-1M] 表示分区时间取调度时间前一月(秒)。
          dt=$[yyyyMMddHHmmss-1H] 表示分区时间取调度时间前一小时(秒)。
          dt=$[yyyyMMddHHmmss-30m] 表示分区时间取调度时间前30分钟(秒)。
          dt=$[HHmmss-1H] 表示分区时间取调度时间前一小时(仅时分秒)。
          dt=$[HHmmss-30m] 表示分区时间取调度时间前30分钟(仅时分秒)。

          创建数据质量规则

          创建数据质量规则需要分别填写数据表信息、规则配置、比较方式、告警配置等信息。

          image.png

          image.png

          配置信息解释如下:

          配置项 解释说明
          数据源 选择数据源名称。
          数据库 选择已选择数据源下的数据库名称。
          数据表 选择已选择数据库下的数据表名称。
          分区表达式 选择已创建的分区表达式,分区表达式文档参考上一节。
          规则名称 输入当前规则的规则名称。
          规则来源 选择内置模板或自定义。
          粒度类型 如果规则来源为内置模板,则包括表粒度和字段粒度;如果规则来源为自定义,则包括表粒度、字段粒度、sql解析。
          规则字段 选择字段粒度时需要选择此信息,可单选或多选字段加入质量稽核规则。
          规则模板 支持下拉选择系统内置的数据质量模板,详细模板信息请参考模板管理。
          采样方式 粒度类型为表级:可选 count 和 count/table ;粒度类型为字段级:可选 sum、max、min、avg。
          强/弱规则 强规则在数据开发的质量节点运用中可阻塞数据处理流程,弱规则不会阻塞工作流。
          校验类型 支持选择数值型、波动型,不同类型的规则比较方式不同。
          校验方式 下拉单选,按校验类型的数值型和波动型显示不同内容,详情如下:
          数值型:与固定值比较、上一周期差值、1天差值。
          波动型:7天平均值波动、30天平均值波动、1天波动、7天波动、30天波动、7天标准差波动、1,7,30天波动、上一周期波动率、1,7,30,本月1号波动率。
          负责人 规则负责人,提交质检规则时,会校验规则负责人是否拥有当前数据表的数据权限。
          维度 当前数据质量规则评估类型(准确性、完整性、一致性、唯一性、有效性、及时性)。
          过滤条件 您可以输入自定义sql过滤条件,多条语句之间使用英文逗号分隔,语句末尾无需添加分号。
          Set Flag 您可以输入自定义SetFlag语句,多条语句之间使用英文逗号分隔,语句末尾无需添加分号。
          自定义sql 当粒度类型是自定义sql时,支持输入sql创建数据质量规则。
          比较方式 根据校验类型选择不同,比较方式的选择范围不同。数值型:选择范围为(大于、大于等于、等于、不等于、小于等于、小于);波动型:选择范围为(绝对值、上升、下降)。
          期望值 当校验方式为数值型时显示,仅支持输入正数和零。
          波动值比较 当校验方式为波动型时显示,可设报警阈值并在右侧可视化显示;(波动率=(样本-基准值)/基准值)。
          联系人 选择告警通知的联系人及告警通道(可在运维中心配置)。
          机器人 选择告警通知的机器人(可在运维中心配置)。

          后续步骤

          • 创建数据质量规则后,您需要前往数据开发 > 工作流开发中创建数据质量节点才可以周期调度。
          • 如果您希望不符合预期的数据质量任务不阻塞数据开发工作流,可以将规则设定为弱规则或者期望抑制管理增加抑制策略,命中抑制策略的规则将不触发告警和阻塞逻辑。
          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  数据质量规则列表
          下一篇 :  试运行质量规则
          搜索 关闭
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明