活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 一键部署Llama3大模型学习机 0代码一键部署,预装最新主流大模型Llama3与StableDiffusion
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心

      查看所有产品

      数据治理中心 DataArts Studio

      数据治理中心 DataArts Studio

        • 产品动态
        • 产品简介
        • 产品定义
        • 产品优势
        • 功能特性
        • 应用场景
        • 术语解释
        • 权限管理
        • 权限列表
        • 约束与限制
        • 数据治理中心DataArts Studio与其他服务的关系
        • 计费说明
        • 资源节点
        • 产品规格
        • 产品价格
        • 计费模式
        • 购买
        • 变更
        • 续订
        • 退订
        • 准备工作
        • 准备工作简介
        • 创建DataArts Studio实例
        • 创建DataArts Studio基础包
        • (可选)创建DataArts Studio增量包
        • 访问DataArts Studio实例控制台
        • 管理工作空间
        • 创建并管理工作空间
        • (可选)修改作业日志存储路径
        • 授权用户使用DataArts Studio
        • 创建IAM用户并授予DataArts Studio权限
        • (可选)自定义工作空间角色
        • 添加工作空间成员和角色
        • (可选)获取认证信息
        • 用户指南
        • 使用DataArts Studio前的准备
        • 管理控制台
        • 创建数据连接
        • 资源迁移
        • 使用教程
        • 新建MRS Hive连接
        • 新建DWS连接
        • 新建MySQL连接
        • DataArts Studio支持的数据源
        • 数据集成
        • 数据集成概述
        • 约束与限制
        • 支持的数据源
        • 管理集群
        • 创建CDM集群
        • 解绑/绑定集群的EIP
        • 重启集群
        • 删除集群
        • 下载集群日志
        • 查看集群基本信息/修改集群配置
        • 监控指标
        • 支持的监控指标
        • 设置告警规则
        • 查看监控指标
        • 管理连接
        • 新建连接
        • 管理驱动
        • 管理Agent
        • 管理集群配置
        • 配置常见关系数据库连接
        • 配置分库连接
        • 配置MySQL数据库连接
        • 配置Oracle数据库连接
        • 配置DLI连接
        • 配置Hive连接
        • 配置HBase连接
        • 配置HDFS连接
        • 配置OBS连接
        • 配置FTP/SFTP连接
        • 配置Redis/DCS连接
        • 配置DDS连接
        • 配置CloudTable连接
        • 配置CloudTable OpenTSDB连接
        • 配置MongoDB连接
        • 配置Cassandra连接
        • 配置Kafka连接
        • 配置DMS Kafka连接
        • 配置Elasticsearch/云搜索服务(CSS)连接
        • 管理作业
        • 新建表/文件迁移作业
        • 新建整库迁移作业
        • 配置作业源端参数
        • 配置OBS源端参数
        • 配置HDFS源端参数
        • 配置HBase/CloudTable源端参数
        • 配置Hive源端参数
        • 配置DLI源端参数
        • 配置FTP/SFTP源端参数
        • 配置HTTP源端参数
        • 配置常见关系数据库源端参数
        • 配置MySQL源端参数
        • 配置Oracle源端参数
        • 配置分库源端参数
        • 配置MongoDB/DDS源端参数
        • 配置Redis源端参数
        • 配置Kafka/DMS Kafka源端参数
        • 配置Elasticsearch或云搜索服务源端参数
        • 配置OpenTSDB源端参数
        • 配置作业目的端参数
        • 配置OBS目的端参数
        • 配置HDFS目的端参数
        • 配置HBase/CloudTable目的端参数
        • 配置Hive目的端参数
        • 配置常见关系数据库目的端参数
        • 配置DWS目的端参数
        • 配置DDS目的端参数
        • 配置DCS目的端参数
        • 配置云搜索服务目的端参数
        • 配置DLI目的端参数
        • 配置OpenTSDB目的端参数
        • 配置定时任务
        • 作业配置管理
        • 管理单个作业
        • 批量管理作业
        • 审计
        • 支持云审计的关键操作
        • 如何查看审计日志
        • 使用教程
        • 创建MRS Hive连接器
        • 创建MySQL连接器
        • MySQL数据迁移到MRS Hive分区表
        • MySQL数据迁移到OBS
        • MySQL数据迁移到DWS
        • MySQL整库迁移到RDS服务
        • Oracle数据迁移到云搜索服务
        • Oracle数据迁移到DWS
        • OBS数据迁移到云搜索服务
        • OBS数据迁移到DLI服务
        • MRS HDFS数据迁移到OBS
        • Elasticsearch整库迁移到云搜索服务
        • DDS数据迁移到DWS
        • 进阶实践
        • 增量迁移原理介绍
        • 文件增量迁移
        • 关系数据库增量迁移
        • 时间宏变量使用解析
        • HBase/CloudTable增量迁移
        • 事务模式迁移
        • 迁移文件时加解密
        • MD5校验文件一致性
        • 字段转换
        • 指定文件名迁移
        • 正则表达式分隔半结构化文本
        • 记录数据迁移入库时间
        • 文件格式介绍
        • 数据架构
        • 数据架构概述
        • 数据架构使用流程
        • 准备工作
        • 添加审核人
        • 管理配置中心
        • 数据调研
        • 流程设计
        • 主题设计
        • 标准设计
        • 新建码表
        • 新建数据标准
        • 模型设计
        • 关系建模
        • 逻辑模型设计
        • 物理模型设计
        • 维度建模
        • 新建维度
        • 管理维度表
        • 新建事实表
        • 指标设计
        • 业务指标
        • 技术指标
        • 新建原子指标
        • 新建衍生指标
        • 新建复合指标
        • 新建时间限定
        • 数据集市建设
        • 新建汇总表
        • 通用操作
        • 逆向数据库(关系建模)
        • 逆向数据库(维度建模)
        • 导入导出表
        • 关联质量规则
        • 查看表
        • 批量修改主题/目录/流程
        • 审核中心
        • 使用教程
        • 数据架构示例
        • 数据开发
        • 数据开发概述
        • 数据管理
        • 数据管理流程
        • 新建数据连接
        • 新建数据库
        • (可选)新建数据库模式
        • 新建数据表
        • 脚本开发
        • 脚本开发流程
        • 新建脚本
        • 开发脚本
        • 开发SQL脚本
        • 开发Shell脚本
        • 开发Python脚本
        • 提交版本并解锁
        • (可选)管理脚本
        • 复制脚本
        • 复制名称与重命名脚本
        • 移动脚本/脚本目录
        • 导出导入脚本
        • 查看脚本引用
        • 删除脚本
        • 迁移脚本责任人
        • 批量解锁
        • 作业开发
        • 作业开发流程
        • 新建作业
        • 开发作业
        • 调度作业
        • 提交版本并解锁
        • (可选)管理作业
        • 复制作业
        • 复制名称和重命名作业
        • 移动作业/作业目录
        • 导出导入作业
        • 删除作业
        • 迁移作业责任人
        • 批量解锁
        • 解决方案
        • 运行历史
        • 运维调度
        • 运维概览
        • 作业监控
        • 批作业监控
        • 实时作业监控
        • 实例监控
        • 补数据监控
        • 通知管理
        • 管理通知
        • 通知周期概览
        • 备份管理
        • 配置管理
        • 配置
        • 配置环境变量
        • 配置OBS桶
        • 管理作业标签
        • 配置委托
        • 配置默认项
        • 管理资源
        • 节点参考
        • 节点概述
        • 节点数据血缘
        • 方案概述
        • 配置数据血缘
        • 查看数据血缘
        • CDM Job
        • Rest Client
        • Import GES
        • MRS Kafka
        • Kafka Client
        • ROMA FDI Job
        • DLI Flink Job
        • DLI SQL
        • DLI Spark
        • DWS SQL
        • MRS Spark SQL
        • MRS Hive SQL
        • MRS Presto SQL
        • MRS Spark
        • MRS Spark Python
        • MRS Flink Job
        • MRS MapReduce
        • CSS
        • Shell
        • RDS SQL
        • ETL Job
        • Python
        • Create OBS
        • Delete OBS
        • OBS Manager
        • Open/Close Resource
        • Data Quality Monitor
        • Sub Job
        • For Each
        • Dummy
        • EL表达式参考
        • 表达式概述
        • 基础操作符
        • 日期和时间模式
        • Env内嵌对象
        • Job内嵌对象
        • StringUtil内嵌对象
        • DateUtil内嵌对象
        • JSONUtil内嵌对象
        • Loop内嵌对象
        • OBSUtil内嵌对象
        • 表达式使用示例
        • 使用教程
        • 作业依赖详解
        • IF条件判断教程
        • 获取Rest Client算子返回值教程
        • For Each算子使用介绍
        • 开发一个Python脚本
        • 开发一个DWS SQL作业
        • 开发一个Hive SQL作业
        • 开发一个DLI Spark作业
        • 开发一个MRS Flink作业
        • 开发一个MRS Spark Python作业
        • 数据质量
        • 业务指标监控
        • 业务指标监控概述
        • 新建指标
        • 新建规则
        • 新建业务场景
        • 查看业务场景实例
        • 数据质量监控
        • 数据质量监控概述
        • 新建规则模板
        • 新建质量作业
        • 新建对账作业
        • 查看规则实例
        • 查看质量报告
        • 使用教程
        • 新建一个业务场景
        • 新建一个质量作业
        • 新建一个作业对账实例
        • 数据目录
        • 数据地图
        • 简介
        • 资产总览
        • 数据目录
        • 标签管理
        • 数据权限
        • 数据权限简介
        • 数据目录权限
        • 数据表权限
        • 审批中心
        • 数据安全(待下线)
        • 数据安全简介
        • 数据密级
        • 数据分类
        • 脱敏策略
        • 元数据采集
        • 元数据简介
        • 任务管理
        • 任务监控
        • 使用教程
        • 开发一个增量元数据采集任务
        • 通过数据地图查看数据血缘关系
        • 方案概述
        • 配置数据血缘
        • 查看数据血缘
        • 数据服务
        • 数据服务概览
        • 规格说明
        • 开发API
        • 准备工作
        • 创建专享版集群
        • 新建审核人
        • 创建API
        • 配置模式生成API
        • 脚本模式生成API
        • 注册API
        • 调试API
        • 发布API
        • 管理API
        • 设置API可见
        • 停用/恢复API
        • 下线/删除API
        • 复制API
        • 全量导出/导出/导入API
        • 流量控制
        • 调用API
        • 审核中心操作说明
        • 常见问题
        • 计费类
        • 购买类
        • 操作类
        • 管理中心
        • 数据集成
        • 数据架构
        • 数据开发
        • 数据质量
        • 数据目录
        • 数据服务
        • 相关协议
        • 数据治理中心 DataArts Studio产品服务协议
        • 数据治理中心 DataArts Studio产品服务等级协议
        • 文档下载
        • 数据治理中心 DataArts Studio用户操作指南
        • 数据治理中心 DataArts Studio故障排除
          无相关产品

          本页目录

          帮助中心 数据治理中心 DataArts Studio 用户指南 数据架构 使用教程 数据架构示例
          数据架构示例
          更新时间 2024-11-13 18:33:37
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2024-11-13 18:33:37
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本章节主要介绍数据架构示例。

          DataArts Studio数据架构以关系建模、维度建模理论支撑,实现规范化、可视化、标准化数据模型开发,定位于数据治理流程设计落地阶段,输出成果用于指导开发人员实践落地数据治理方法论。

          本章节操作场景如下:

          • 对MRS Hive数据湖中的出租车出行数据进行数据模型设计。
          • 数据库demo_sdi_db中已具备出租车出行原始数据表sdi_taxi_trip_data。
          • 原始数据表sdi_taxi_trip_data的数据字段介绍如下:

          数据说明如下:

          下表为出租车行程数据

          序号 字段名称 字段描述
          1 VendorID 供应商编号
          取值如下:
          1=A Company
          2=B Company
          2 tpep_pickup_datetime 上车时间
          3 tpep_dropoff_datetime 下车时间
          4 passenger_count 乘客人数
          5 trip_distance 行驶距离
          6 ratecodeid 费率代码
          取值如下:
          1=Standard rate
          2=JFK
          3=Newark
          4=Nassau or Westchester
          5=Negotiated fare
          6=Group ride
          7 store_fwd_flag 存储转发标识
          8 PULocationID 上车地点
          9 DOLocationID 下车地点
          10 payment_type 付款方式代码
          取值如下:
          1=Credit card
          2=Cash
          3=No charge
          4=Dispute
          5=Unknown
          6=Voided trip
          11 fare_amount 车费
          12 extra 加收
          13 mta_tax MTA税
          14 tip_amount 手续费
          15 tolls_amount 通行费
          16 improvement_surcharge 改善附加费
          17 total_amount 总车费

          数据架构的流程如下:

          1. 准备工作 :
          • 添加审核人 :在数据架构中,业务流程中的步骤都需要经过审批,因此,需要先添加审核人。只有工作空间管理员角色的用户才具有添加审核人的权限。
          • 管理配置中心 :数据架构中提供了丰富的自定义选项,统一通过配置中心提供,您需要根据自己的业务需要进行自定义配置。
          1. 数据调研 :基于现有业务数据、行业现状进行数据调查、需求梳理、业务调研,输出企业业务流程以及数据主题划分。
          • 主题设计 :通过分层架构表达对数据的分类和定义,帮助厘清数据资产,明确业务领域和业务对象的关联关系。
          • 流程设计 :本例暂不涉及。流程设计是针对流程的一个结构化的整体框架,描述了企业流程的分类、层级以及边界、范围、输入/输出关系等,反映了企业的商业模式及业务特点。
          1. 标准设计 :新建码表&数据标准。
          • 新建码表并发布 :通常只包括一系列允许的值和附加文本描述,与数据标准关联用于生成值域校验质量监控。
          • 新建数据标准并发布 :用于描述公司层面需共同遵守的属性层数据含义和业务规则。其描述了公司层面对某个数据的共同理解,这些理解一旦确定下来,就应作为企业层面的标准在企业内被共同遵守。
          1. 模型设计: 应用关系建模和维度建模的方法,进行分层建模。
          • 关系建模:新建SDI 层和DWI层两个模型 。

          -SDI :Source Data Integration,又称贴源数据层。SDI是源系统数据的简单落地。

          -DWI :Data Warehouse Integration,又称数据整合层。DWI整合多个源系统数据,对源系统进来的数据进行整合、清洗,并基于三范式进行关系建模。

          • 维度建模:在DWR层新建并发布维度 & 维度建模:在DWR层新建并发布事实表。

          -DWR :Data Warehouse Report,又称数据报告层。DWR基于多维模型,和DWI层数据粒度保持一致。

          -维度 :维度是用于观察和分析业务数据的视角,支撑对数据进行汇聚、钻取、切片分析,用于SQL中的GROUP BY条件。

          -事实表 :归属于某个业务过程的事实逻辑表,可以丰富具体业务过程所对应事务的详细信息。

          1. 指标设计:新建并发布技术指标 :新建业务指标(本例不涉及)和技术指标,技术指标又分为原子指标、衍生指标和复合指标。
          • 指标 :指标一般由指标名称和指标数值两部分组成,指标名称及其涵义体现了指标质的规定性和量的规定性两个方面的特点,指标数值反映了指标在具体时间、地点、条件下的数量表现。

          业务指标用于指导技术指标,而技术指标是对业务指标的具体实现。

          • 原子指标 :原子指标中的度量和属性来源于多维模型中的维度表和事实表,与多维模型所属的业务对象保持一致,与多维模型中的最细数据粒度保持一致。

          原子指标中仅含有唯一度量,所含其它所有与该度量、该业务对象相关的属性,旨在用于支撑指标的敏捷自助消费。

          • 衍生指标 :是原子指标通过添加限定、维度卷积而成,限定、维度均来源于原子指标关联表的属性。
          • 复合指标 :由一个或多个衍生指标叠加计算而成,其中的维度、限定均继承于衍生指标。

          注意,不能脱离衍生指标、维度和限定的范围,去产生新的维度和限定。

          1. 维度建模:在DM 层新建并发布汇总表 。
          • DM (Data Mart) :又称数据集市。DM面向展现层,数据有多级汇总。
          • 汇总表 :汇总表是由一个特定的分析对象(如会员)及其相关的统计指标组成的。组成一个汇总逻辑表的统计指标都具有相同的统计粒度(如会员),汇总逻辑表面向用户提供了以统计粒度(如会员)为主题的所有统计数据(如会员主题集市)。

          添加审核人

          在数据架构中,数据建模流程中的步骤都需要经过审批,因此,需要先添加审核人。DAYU Administrator角色或该工作空间管理员,具备对应的添加审核人的权限。

          1. 在DataArts Studio控制台首页,选择实例,点击“进入控制台”,选择对应工作空间的“数据架构”模块,进入数据架构页面。

          image.png

          1. 单击左侧导航树中的“配置中心”,进入相应页面后,在“审核人管理”页签,单击“添加”按钮。
          2. 选择审核人(工作空间管理员或开发者),输入正确的电子邮箱和手机号,单击“确定”完成审核人添加。

          您也可以添加自己当前帐号为审核人,在后续提交审批的相关操作中,支持进行“自助审批”。根据需要,可以添加多个审核人。

          image.png

          管理配置中心

          数据架构中提供了丰富的自定义选项,统一通过配置中心提供,您可有根据自己的业务需要进行自定义配置。

          1. 在数据架构控制台,单击左侧菜单栏的“配置中心”,进入配置中心页面。
          2. 进入“功能配置”页签,按照您的需求,进行自定义设置。
          3. 单击“确定”完成配置。

          主题设计

          在本示例中,主题设计如表所示,说明如下:

          • 新建1个主题域分组:城市交通。
          • 在主题域分组“城市交通”下,新建4个主题域:行程记录、集团、时空、公共维度。
          • 在主题域“行程记录”下,新建4个业务对象:原始记录、标准记录、行程事实、记录统计。
          • 在主题域“集团”下,新建1个业务对象:供应商。
          • 在主题域“时空”下,新建1个业务对象:时间。
          • 在主题域“公共维度”下,新建1个业务对象:公共维度。

          下表为主题设计信息

          主题域分组名称(L1) 主题域分组编码(L1) 主题域名称(L2) 主题域编码(L2) 业务对象名称(L3) 业务对象编码(L3)
          城市交通 city_traffic 行程记录 stroke_reminder 原始记录 origin_stroke
          城市交通 city_traffic 行程记录 stroke_reminder 标准记录 stand_stroke
          城市交通 city_traffic 行程记录 stroke_reminder 行程事实 stroke_fact
          城市交通 city_traffic 行程记录 stroke_reminder 记录统计 stroke_statistic
          城市交通 city_traffic 集团 people 供应商 vendor
          城市交通 city_traffic 时空 time_location 时间 date
          城市交通 city_traffic 公共维度 public_dimension 公共维度 public_dimension

          image.png

          操作步骤如下:

          1. 登录DataArts Studio控制台。找到已创建的DataArts Studio实例,单击实例卡片上的“进入控制台”。
          2. 在工作空间概览列表中,找到所需要的工作空间,单击“数据架构”,进入数据架构控制台。
          3. 在数据架构控制台,单击左侧菜单栏的“配置中心”。选择“ 主题层级”,使用默认的3层层级。

          L1-L7表示主题层级,默认3层,最大7层,最少2层,最后一层是业务对象,其他层级名称可编辑修改。配置中心配置的层级数,将在“主题设计”模块生效。

          image.png

          1. 在数据架构控制台,单击左侧菜单栏的“主题设计”,进入相应页面后,单击“新建”创建L1层主题,即主题域分组。

          image.png

          在弹出窗口中,按图所示填写参数,然后单击“确定”完成主题域分组的创建。

          1. 在L1层主题“城市交通”下,依次新建4个L2层主题,即主题域:行程记录、集团、时空、公共维度。

          以主题域“行程记录”为例,新建主题域的步骤如下,其他主题域也请参照以下步骤进行添加:

          a.选中已创建的L1层主题“城市交通”。单击右键,选择“新建”。或者单击右侧的“新建”按钮。

          image.png

          b.在弹出窗口中,“名称”和“编码”请参照上方 主题设计信息 表中的“主题域名称”和“主题域编码”进行填写,其他参数可根据实际情况进行填写,配置完成后单击“确定”完成主题域的新建。

          1. 新建业务对象。
          • 在主题域“行程记录”下,新建4个业务对象:原始记录、标准记录、行程事实、记录统计。
          • 在主题域“集团”下,新建1个业务对象:供应商。
          • 在主题域“时空”下,新建1个业务对象:时间。
          • 在主题域“公共维度”下,新建1个业务对象:公共维度。

          以在主题域“行程记录”下新建业务对象“原始记录”为例,新建业务对象的步骤如下,其他业务对象也请参照以下步骤进行添加:

          a.选中已创建的L2层主题“行程记录”。单击右键,选择“新建”。或者单击右侧的“新建”按钮。

          b.在弹出窗口中,“名称”和“编码”请参照上方 主题设计信息 表中的“业务对象名称”和“业务对象编码”进行填写,其他参数可根据实际情况进行填写,配置完成后单击“确定”完成业务对象新建。

          新建码表并发布

          在本示例中,您需要新建如表所示的3个码表:

          目录 *表名称 *表编码 表描述 *字段名称 *字段编码 *字段数据类型 字段描述
          付款方式 付款方式 payment_type 无 付款方式编码 payment_type_id BIGINT 无
          付款方式 付款方式 payment_type 无 付款方式值 payment_type_value STRING 无
          供应商 供应商 vendor 无 供应商id vendor_id BIGINT 无
          供应商 供应商 vendor 无 供应商 vendor_value STRING 无
          费率 费率代码 rate_code 无 费率id rate_code_id BIGINT 无
          费率 费率代码 rate_code 无 费率说明 rate_code_value STRING 无

          操作步骤如下:

          1. 在数据架构控制台,单击左侧导航树中的“码表管理”,进入码表管理页面。
          2. 新建3个码表目录:付款方式、供应商、费率。

          以新建“付款方式”目录为例,新建目录步骤如下,其他目录也请参照以下步骤进行新建。

          a.在码表管理页面,单击码表目录树中上方的圆加号.png新建目录。

          image.png

          b.在弹出框中,输入目录名称,选择目录,然后单击“确定”。

          image.png

          1. 新建3个码表:付款方式、供应商、费率代码。

          以新建“付款方式”码表为例,新建码表步骤如下,其他码表也请参照以下步骤完成新建:

          a.在码表管理页面,在码表目录树中选择一个目录,然后在右侧单击“新建”按钮。

          image.png

          b.在新建码表页面中,请参考表配置参数,然后单击“保存”。

          image.png

          c.参考步骤步骤3.1~步骤3.2,在供应商目录下创建供应商码表,在费率目录下创建费率码表。

          image.png

          image.png

          1. 分别为付款方式、供应商、费率3个码表填写数值。

          在“码表管理”页面,找到码表“付款方式”,然后在该码表所在行选择“更多 > 填写数值”。在填写数值页面,依次单击“新建”添加如下表所示的数值。

          下表为付款方式码表的数值

          付款方式编码payment_type_id 付款方式值payment_type_value
          1 Credit card
          2 Cash
          3 No charge
          4 Dispute
          5 Unknown
          6 Voided trip

          返回“码表管理”页面,找到码表“供应商”,然后在该码表所在行选择“更多 > 填写数值”。在填写数值页面,依次单击“新建”添加如下表所示的数值。

          下表为供应商码表的数值

          供应商idvendor_id 供应商vendor_value
          1 A Company
          2 B Company

          返回“码表管理”页面,找到码表“费率代码”,然后在该码表所在行选择“更多 > 填写数值”。在填写数值页面,依次单击“新建”添加如下表所示的数值。

          下表为费率码表的数值

          费率idrate_code_id 费率说明rate_code_value
          1 Standard rate
          2 JFK
          3 Newark
          4 Nassau or Westchester
          5 Negotiated fare
          6 Group ride
          1. 返回码表管理页面后,在码表列表中,选中刚才新建的3个码表,然后单击“发布”发布码表。
          2. 在“批量发布”对话框中选择审核人,再单击“确认提交”,等待审核人员审核通过后,码表发布成功。如果当前帐号具备审核人权限,也可以勾选“自助审批”,直接提交即可以审核通过。

          新建数据标准并发布

          在本示例中,您需要新建如表所示的3个数据标准:

          下表为数据标准

          目录 *标准名称 *标准编码(自定义) *数据类型 数据长度 引用码表 *码表字段 描述
          付款方式 付款方式 payment_type 长整型(BIGINT) 无 付款方式 付款方式编码 无
          供应商 供应商 vendor 长整型(BIGINT) 无 供应商 供应商id 无
          费率 费率代码 rate_code 长整型(BIGINT) 无 费率代码 费率id 无
          1. 在数据架构控制台,单击左侧导航树中的“数据标准”,进入数据标准页面。
          2. 首次进入“数据标准”页面,需要定制模板,定制的模板后续可以在配置中心进行更改。本示例需要额外勾选“引用码表”,如图所示。

          image.png

          1. 请参考以下步骤,分别新建3个数据标准的目录:付款方式、供应商、费率。

          在数据标准页面的目录树上方,单击圆加号.png新建目录,然后在弹出框中输入目录名称“付款方式”并选择目录,单击“确定”完成目录的新建。

          image.png

          1. 请参考以下步骤,分别新建3个数据标准:付款方式、供应商、费率。

          a.在数据标准页面的目录树中,选中所需要的目录,然后在右侧页面中单击“新建”。

          b.在新建数据标准页面中,3个数据标准可分别参考如下配置,配置完成后单击“保存”。在本示例中,数据标准模板只选取了几个参数,您可以参考用户指南中的“数据架构> 管理配置中心”的“标准模板管理”定制数据标准模板。

          image.png

          image.png

          image.png

          1. 返回数据标准页面后,在列表中勾选刚才新建的3个数据标准,然后单击“发布”发布数据标准。
          2. 在“批量发布”对话框中选择审核人,再单击“确认提交”,等待审核人员审核通过后,数据标准发布成功。如果当前帐号具备审核人权限,也可以勾选“自助审批”,直接提交即可以审核通过。

          关系建模:新建SDI层和DWI层两个模型

          在关系建模中,分别新建SDI层和DWI层两个关系模型,并通过逆向数据库导入原始数据表到SDI层的关系模型中,在DWI层模型中新建一个“标准出行数据”的标准化的业务表。

          1. 在数据架构控制台,单击左侧导航树中的“关系建模”。
          • 如果当前未创建过关系模型,系统会弹出“新建分层治理模型”提示框。您可以新建一个SDI层关系模型,命名为“sdi”,再新建一个DWI层关系模型,命名为“dwi”。单击“确定”即可。

          image.png

          • 如果不是首次创建,单击加号.png新建物理模型,如下图所示。

          image.png

          a. 先新建一个SDI层关系模型,命名为“sdi”。在物理模型页签中,单击,新建模型,配置如下参数,单击“确定”。

          image.png

          b. 再新建一个DWI层关系模型,命名为“dwi”。在物理模型页签中,单击加号.png,新建模型,配置如下参数,单击“确定”。

          image.png

          1. 在“数仓分层”页签中,单击新建的SDI关系模型,展开,选中业务对象“城市交通 > 行程记录 > 原始记录”,单击“逆向数据库”,通过逆向数据库,导入原始表。

          image.png

          在“逆向数据库”窗口中,配置如下所示参数,然后单击“确定”。在本示例中选择贴源层数据库demo_sdi_db中的原始数据表。

          image.png

          逆向数据库成功后,单击“关闭”。您可以在列表中查看导入的表:

          image.png

          1. 请参照以下步骤,新建一个“标准出行数据”的标准化的业务表。

          a.在“数仓分层”页签中,单击新建的DWI关系模型,展开,选中DWI模型中的业务对象“城市交通 > 行程记录 > 原始记录”,然后在右侧列表上方单击“新建”按钮,进入新建表页面。

          b.在新建表的“基本配置”标签页中,配置如下:

          image.png

          c.进入“表字段”标签页,单击“新建”,在标准出行数据表中,依次添加如下表所示的字段,并单击字段供应商编号、费率代码、付款方式的“数据标准”列中的按钮设置.png,分别关联数据标准“供应商”、“费率代码”和“付款方式”。

          下表为标准出行数据表字段

          序号 名称 编码 数据类型 数据标准 主键 分区 不为空 标签
          1 供应商编号 vendor_id 长整型(BIGINT) 供应商 不勾选 不勾选 勾选 -
          2 上车时间 tpep_pickup_datetime 时间戳类型(TIMESTAMP) - 不勾选 不勾选 勾选 -
          3 下车时间 tpep_dropoff_datetime 时间戳类型(TIMESTAMP) - 不勾选 不勾选 勾选 -
          4 乘客人数 passenger_count 字符类型(STRING) - 不勾选 不勾选 勾选 -
          5 行驶距离 trip_distance 高精度(DECIMAL)(10,2) - 不勾选 不勾选 勾选 -
          6 费率代码 rate_code_id 长整型(BIGINT) 费率代码 不勾选 不勾选 勾选 -
          7 存储转发标识 store_fwd_flag 字符类型(STRING) - 不勾选 不勾选 勾选 -
          8 上车地点 pu_location_id 字符类型(STRING) - 不勾选 不勾选 勾选 -
          9 下车地点 do_location_id 字符类型(STRING) - 不勾选 不勾选 勾选 -
          10 付款方式代码 payment_type 长整型(BIGINT) 付款方式 不勾选 不勾选 勾选 -
          11 车费 fare_amount 高精度(DECIMAL)(10,2) - 不勾选 不勾选 勾选 -
          12 加收 extra 高精度(DECIMAL)(10,2) - 不勾选 不勾选 勾选 -
          13 MTA税 mta_tax 高精度(DECIMAL)(10,2) - 不勾选 不勾选 勾选 -
          14 手续费 tip_amount 高精度(DECIMAL)(10,2) - 不勾选 不勾选 勾选 -
          15 通行费 tolls_amount 高精度(DECIMAL)(10,2) - 不勾选 不勾选 勾选 -
          16 改善附加费 improvement_surcharge 高精度(DECIMAL)(10,2) - 不勾选 不勾选 勾选 -
          17 总车费 total_amount 高精度(DECIMAL)(10,2) - 不勾选 不勾选 勾选 -

          image.png

          对于标准出行数据表中的字段,您可以执行以下操作。

          • 关联数据标准

          在新建表或编辑表时,进入“表字段”标签页,在字段所在行的“数据标准”列,单击设置.png按钮可以选择一个数据标准与字段相关联。将字段关联数据标准后,表发布上线后,就会自动生成一个质量作业,每个关联了数据标准的字段会生成一个质量规则,基于数据标准对字段进行质量监控,您可以前往DataArts Studio数据质量模块的“质量作业”页面进行查看。有关关联数据标准的更多信息,请参见用户指南中的“数据架构> 关系建模 > 物理模型设计”中的“新建表并发布”。

          • 添加标签

          标签是用户自定义的标识。添加标签后,您就可以在DataArts Studio数据目录模块中通过标签搜索相关的数据资产。

          在新建表或编辑表时,进入“表字段”标签页,在字段所在行的“标签”列,单击设置.png按钮可以添加标签,在弹出框中,您可以输入新的标签名称后按回车,也可以在下拉列表中选择已有标签。

          • 关联质量规则

          完成表的新建后,您可以在表中为字段关联质量规则,完成关联后,当表发布成功后,就会在DataArts Studio数据质量中自动创建质量作业,如果当前表已经发布,则系统会自动更新质量作业。有关关联质量规则的更多信息,请参见用户指南中的“数据架构> 关系建模 > 关联质量规则”。

          d.接下来,进入“映射”标签页,通过新建映射设计表的数据来源。

          • 如果表中的字段数据来源于不同的关系模型,您需要创建多个映射。在每个映射中,您只需要为来源于当前映射的字段设置源字段,其他字段可以不设置。
          • 如果表中的字段数据来源于同一个关系模型中的多个表,您可以新建一个映射。在该映射的“源表”中,您可以将多个表设置Join,然后再为表中的字段设置源字段。

          本示例只需要新建一个映射。单击“新建”,新建一个映射,如下图。

          • 映射名称 :新建映射时会自动生成,您也可以修改。
          • 来源模型 :本示例选择“sdi”。
          • 源表 :本示例选择原始数据表“sdi_taxi_trip_data”,标准出行数据表的数据均来源于该原始数据表。

          image.png

          • 字段映射 :

          在“字段映射”区域,依次为表中的字段设置源字段,所选择的源字段应与表中的字段代表相同含义,一一对应。如下图所示,在字段映射的底部,会显示生成的SQL语句,可供参考。

          说明
          • 如果在“数据架构 > 配置中心 > 功能配置”页面中开启了“模型设计业务流程步骤 > 创建数据开发作业”(默认为关闭),发布表时,系统支持根据表的映射信息,在数据开发中自动创建一个ETL作业,每一个映射会生成一个ETL节点,作业名称以“ *数据库名称_表编码* ”开头。当前该功能处于内测阶段,仅支持DLI->DLI和DLI->DWS两种映射的作业创建。

          已创建的ETL作业可以进入“数据开发 > 作业开发”页面查看。ETL作业默认每天0点启动调度。

          • 在本示例中,不支持自动创建ETL作业,映射信息仅为数据开发提供数据的ETL流向。在做数据开发的过程中,可以参考此处的映射关系编写SQL脚本。

          image.png

          e.完成映射的配置后,出租车行程数据表配置完成,单击“保存”。

          1. 模型创建好之后,勾选已创建的模型,选择“更多 > 导出”,然后在弹出框中选中“表”并单击“确定”,可以将整个模型导出。参考同样的方法导出模型“sdi”。导出后的模型,可以作为备份,今后可用于模型导入。

          image.png

          1. 发布表模型。

          a.发布步骤2中通过逆向数据库导入SDI模型的原始表,发布后,就可以通过DataArts Studio对原始表进行管理和监控。

          返回关系建模页面,在模型目录选择“sdi”模型,然后在右侧的列表中,勾选表sdi_taxi_trip_data,再单击“发布”,然后在弹出框中选择审核人,单击“确认提交”,等待审核人员审核通过后,“sdi”模型发布成功。如果当前帐号具备审核人权限,也可以勾选“自助审批”,直接提交即可以审核通过。

          b.发布DWI模型中的表。

          返回关系建模页面,在模型目录中选择“dwi”模型,然后在右侧的列表中,勾选表“标准出行数据”,再单击“发布”,然后在弹出框中选择审核人,单击“确认提交”,等待审核人员审核通过后,“dwi”模型发布成功。如果当前帐号具备审核人权限,也可以勾选“自助审批”,直接提交即可以审核通过。

          1. 当表模型发布成功后,进入数据架构的“关系建模”页面可以查看表的“状态”和“同步状态”。

          发布是一个异步操作,您可以单击刷新-大.png按钮刷新状态。表发布并通过审核后,系统会依据“配置中心 > 功能配置”页面中的“模型设计业务流程步骤”进行创建表、同步技术资产、同步业务资产等操作,在表的“同步状态”一列中将显示同步状态。

          • “同步状态”若均显示成功,则说明表发布成功。鼠标移至“同步状态”中的绿色表格.png图标之上,若显示“创建表: 创建成功”说明该表在对应的数据源下已经创建成功。
          • “同步状态”若显示某一项或某几项失败,可以先刷新状态。如果仍失败,可以选择操作列的“更多 > 发布历史”,然后进入“发布日志”标签页查看日志。

          请根据错误日志定位失败原因,问题解决后,再返回“关系建模”页面,在列表中勾选需同步的表,然后选择“更多 > 同步”尝试重新同步。如果仍同步失败,请联系技术支持人员协助解决。

          image.png

          在列表中单击表名,可以查看表的详情,其中“数据源”显示了表的位置。

          image.png

          维度建模:在DWR层新建并发布维度

          在维度建模中,在DWR数据报告层中新建3个码表维度(供应商、费率代码和付款方式)和1个层级维度(日期维度)。

          1. 在数据架构控制台,单击左侧导航树中的“维度建模”,进入维度建模页面。
          2. 新建如表所示的3个码表维度。
          *所属主题 *维度名称 *维度英文名称 *维度类型 *资产责任人 描述 *数据连接类型 *数据连接 *数据库 选择码表
          供应商 供应商 dim_vendor 码表维度 - 无 MRS_HIVE mrs_hive_link demo_dwr_db 供应商
          公共维度 费率代码 dim_rate_code 码表维度 - 无 MRS_HIVE mrs_hive_link demo_dwr_db 费率
          公共维度 付款方式 dim_payment_type 码表维度 - 无 MRS_HIVE mrs_hive_link demo_dwr_db 付款方式

          a.在“维度建模”页面进入“维度”标签页,在主题树中选中“城市交通 > 集团 > 供应商”,然后单击“新建”新建供应商维度。

          image.png

          b.在新建维度页面,如下图所示配置参数,然后单击“保存”完成维度的新建。

          image.png

          c.在“维度建模”页面进入“维度”标签页,在主题树中选中“城市交通 > 公共维度 > 公共维度”,然后单击“新建”新建费率代码维度。在新建维度页面,配置如下,配置完成后单击“保存”。

          image.png

          d.在“维度建模”页面进入“维度”标签页,在主题树中选中“城市交通 > 公共维度 > 公共维度”,然后单击“新建”新建付款方式维度。在新建维度页面,维度配置如下,配置完成后单击“保存”。

          image.png

          1. 新建一个层级维度“日期维度”。

          a.在“维度建模”页面进入“维度”标签页,在主题树中选中“城市交通 > 时空 > 时间”,然后单击“新建”新建日期维度。

          b.基本配置和物化配置如下:

          下表为日期维度

          *所属主题 *维度名称 *维度英文名称 *维度类型 *资产责任人 描述 *数据连接类型 *数据连接 *数据库
          时间 日期维度 dim_date 层级维度 - 无 MRS_HIVE mrs_hive_link demo_dwr_db

          image.png

          c.属性配置如下:

          序号 属性名称 属性英文名称 数据标准 数据类型 代理键 主键 分区 不为空
          1 日期维度 dim_date_key - TIMESTAMP 选中 选中 不勾选 勾选
          2 时间 real_time - TIMESTAMP 不选 不选 不勾选 不勾选
          3 分id minute_id - BIGINT 不选 不选 不勾选 不勾选
          4 分 minute - BIGINT 不选 不选 不勾选 不勾选
          5 时id hour_id - BIGINT 不选 不选 不勾选 不勾选
          6 时 hour - BIGINT 不选 不选 不勾选 不勾选
          7 日id day_id - BIGINT 不选 不选 不勾选 不勾选
          8 日 day - STRING 不选 不选 不勾选 不勾选
          9 月id month_id - BIGINT 不选 不选 不勾选 不勾选
          10 月 month - STRING 不选 不选 不勾选 不勾选
          11 年id year_id - BIGINT 不选 不选 不勾选 不勾选
          12 年 year - BIGINT 不选 不选 不勾选 不勾选

          image.png

          d.在层级配置区域,单击“新建”,新建如下2个层级:

          image.png

          image.png

          e.新建维度页面配置完成后,单击“保存”。

          1. 返回维度页面后,在维度列表中,勾选刚才新建的4个维度,再单击“发布”。
          2. 在“批量发布”对话框中,选择审核人,单击“确认提交”,等待审核人员审核通过后,维度发布成功。如果当前帐号具备审核人权限,也可以勾选“自助审批”,直接提交即可以审核通过。
          3. 完成所有维度的新建和发布,待审核通过后,系统会自动创建与维度相对应的维度表,维度表的名称和编码均与维度相同。在“维度建模”页面,选择“维度表”页签,可以查看建好的维度表。

          在维度表列表中,在“同步状态”一列中可以查看维度表的同步状态。

          • 如果同步状态均显示成功,则说明维度发布成功,维度表在数据库中创建成功。
          • 如果同步状态中存在失败,可单击该维度表所在行的“发布历史”,然后在展开的页面中进入“发布日志”页签查看日志。请根据错误日志定位失败原因,问题解决后,您可以勾选该维度表,再单击列表上方的“同步”按钮尝试重新同步。如果问题仍未能解决,请联系技术支持人员协助处理。

          image.png

          维度建模:在DWR层新建并发布事实表

          在维度建模中,在DWR数据报告层中新建一个事实表“行程订单”。

          1. 在数据架构控制台,单击左侧导航树中的“维度建模”,进入维度建模页面。
          2. 单击“事实表”页签,进入事实表页面。在左侧的主题树中选择业务对象“城市交通 > 行程记录 > 行程事实”,然后单击“新建”按钮开始新建行程订单表。

          在新建事实表页面的“基本配置”区域,配置如下:

          • 所属主题:主题域分组:城市交通>主题域:行程记录>业务对象:行程事实
          • 表名称:行程订单
          • 表英文名称:fact_stroke_order
          • 数据连接类型:MRS_HIVE
          • 数据连接:mrs_hive_link
          • 数据库:demo_dwr_db
          • 表类型:HIVE_TABLE
          • 资产责任人:在下拉列表中选择一个责任人。
          • 描述:无

          在“字段配置”区域,选择 " 新建 > 维度",在弹出框中选择维度“费率代码”、“供应商”、“付款方式”、“日期维度”,单击“确定”。再次选择 " 新建 > 维度",在弹出框中选择“日期维度”并单击“确定”。然后,在维度字段列表中,调整维度字段的顺序,并修改2个日期维度的信息,如表所示。

          序号 字段名称 字段英文名称 数据类型 主键 分区 不为空 关联数据标准 关联维度 角色 描述
          1 费率id rate_code_id BIGINT 不勾选 不勾选 不勾选 - 费率代码 dim_ -
          2 供应商id vendor_id BIGINT 不勾选 不勾选 不勾选 - 供应商 dim_ -
          3 付款方式编码 payment_type_id BIGINT 不勾选 不勾选 不勾选 - 付款方式 dim_ -
          4 上车时间 dim_pickup_date_key TIMESTAMP 不勾选 不勾选 不勾选 - 日期维度 dim_pickup 日期层维表
          5 下车时间 dim_dropoff_date_key TIMESTAMP 不勾选 不勾选 不勾选 - 日期维度 dim_dropoff 日期层维表

          在“字段配置”区域,选择“新建 > 度量”,依次新建如表所示的字段。

          序号 字段名称 字段英文名称 数据类型 主键 分区 不为空 关联数据标准
          6 上车地点 pu_location_id 字符类型(STRING) 不勾选 不勾选 不勾选 -
          7 下车地点 do_location_id 字符类型(STRING) 不勾选 不勾选 不勾选 -
          8 车费 fare_amount 高精度(DECIMAL) (10,2) 不勾选 不勾选 不勾选 -
          9 加收 extra 高精度(DECIMAL) (10,2) 不勾选 不勾选 不勾选 -
          10 MTA税 mta_tax 高精度(DECIMAL) (10,2) 不勾选 不勾选 不勾选 -
          11 手续费 tip_amount 高精度(DECIMAL) (10,2) 不勾选 不勾选 不勾选 -
          12 通行费 tolls_amount 高精度(DECIMAL) (10,2) 不勾选 不勾选 不勾选 -
          13 改善附加费 improvement_surcharge 高精度(DECIMAL) (10,2) 不勾选 不勾选 不勾选 -
          14 总车费 total_amount 高精度(DECIMAL) (10,2) 不勾选 不勾选 不勾选 -

          image.png

          1. 新建事实表页面配置完成后,单击“发布”提交审核。
          2. 在弹出框中选择审核人,单击“确认提交”,等待审核人员审核通过后,事实表发布成功。如果当前帐号具备审核人权限,也可以勾选“自助审批”,直接提交即可以审核通过。
          3. 返回“维度建模 > 事实表”页面,在列表中找到刚发布的事实表,在“同步状态”一列中可以查看事实表的同步状态。
          • 如果同步状态均显示成功,则说明事实表发布成功,事实表在数据库中已创建成功。
          • 如果同步状态中存在失败,可单击该事实表所在行的“更多 > 发布历史”,然后在展开的页面中进入“发布日志”页签查看日志。请根据错误日志定位失败原因,问题解决后,您可以在事实表页面勾选该事实表,再单击列表上方的“更多 > 同步”尝试重新同步。如果问题仍未能解决,请联系技术支持人员协助处理。

          指标设计:新建并发布技术指标

          在本示例中,您需要新建如表所示的技术指标:

          *指标名称 *指标英文名称 数据表 *所属主题 *设定表达式 描述
          总车费 sum_total_amount 行程订单 行程事实 sum (总车费) 无
          指标 *数据表 *所属主题 *原子指标 统计维度 时间限定 通用限定
          基于付款方式维度统计总车费 行程订单 记录统计 总车费 付款方式 无 无
          基于费率代码维度统计总车费 行程订单 记录统计 总车费 费率代码 无 无
          基于供应商和下车时间维度统计总车费 行程订单 记录统计 总车费 供应商,行程订单.下车时间 无 无
          1. 在数据架构控制台,单击左侧导航树中的“技术指标”,进入技术指标页面。
          2. 新建一个原子指标“总车费”,用于统计总车费。

          a.在技术指标页面,进入“原子指标”标签页,然后单击“新建”按钮。

          b.在新建原子指标页面配置如下,配置完成后单击“发布”。

          image.png

          c.等待审核人审核通过。审核通过后,原子指标就创建好了。

          1. 当原子指标通过审核后,新建以下3个衍生指标。
          • 总车费(付款方式):基于付款方式维度统计总车费

          在技术指标页面,进入“衍生指标”标签页,然后单击“新建”按钮,在新建衍生指标页面,配置如下。配置完成后,单击“试运行”,并在弹出窗口中单击“执行”,如果运行通过单击“保存”。

          image.png

          • 总车费(费率代码):基于费率代码维度统计总车费

          在技术指标页面,进入“衍生指标”标签页,然后单击“新建”按钮,在新建衍生指标页面,配置如下。配置完成后,单击“试运行”,并在弹出窗口中单击“执行”,如果运行通过单击“保存”。

          image.png

          • 截止当日_总车费(供应商,行程订单.下车时间):基于供应商维度统计总车费

          在技术指标页面,进入“衍生指标”标签页,然后单击“新建”按钮,在新建衍生指标页面,配置如下。配置完成后,单击“试运行”,并在弹出窗口中单击“执行”,如果运行通过单击“保存”。

          image.png

          1. 返回技术指标页面的“衍生指标”标签页后,勾选建好的3个衍生指标,单击“发布”,在弹出框中选择审核人,单击“确认提交”,等待审核人员审核通过后,事实表发布成功。如果当前帐号具备审核人权限,也可以勾选“自助审批”,直接提交即可以审核通过。

          维度建模:在DM层新建并发布汇总表

          在DM数据集市层,您需要新建如表所示的汇总表。

          *所属主题 *表名称 *表英文名称 统计维度 数据连接类型 *数据连接 *数据库 资产责任人 描述
          记录统计 付款方式统计汇总 dws_payment_type 付款方式 MRS_HIVE mrs_hive_link demo_dm_db - 无
          记录统计 费率统计汇总 dws_rate_code 费率代码 MRS_HIVE mrs_hive_link demo_dm_db - 无
          记录统计 供应商统计汇总 dws_vendor 供应商,行程订单.下车时间 MRS_HIVE mrs_hive_link demo_dm_db - 无
          1. 在数据架构控制台,单击左侧导航树中的“维度建模”,进入维度建模页面。
          2. 单击“汇总表”页签,进入汇总表页面。
          3. 新建3个汇总表:付款方式统计汇总表、费率统计汇总表、供应商统计汇总表。

          a.在“汇总表”页面,在主题树中选中“城市交通 > 行程记录 > 记录统计”,然后单击“新建”新建付款方式统计汇总表。在新建汇总表页面,配置如下,配置完成后单击“保存”。

          在新建汇总表页面,基本配置如下:

          image.png

          在“时间分区”区域,输入字段编码以及选择数据类型。当表发布成功后,在往表里写数据时,将根据该时间分区字段进行分区。

          image.png

          在“指标配置”区域,单击“添加”,添加衍生指标“总车费(付款方式)”。此处只能添加与所指定的“统计维度”相关联的并且已发布的衍生指标或复合指标。

          image.png

          完成上述配置后,单击“保存”。

          b.在“汇总表”页面,在主题树中选中“城市交通 > 行程记录 > 记录统计”,然后单击“新建”新建费率统计汇总表。在新建汇总表页面,配置如下,配置完成后单击“保存”。

          image.png

          image.png

          c.在“汇总表”页面,在主题树中选中“城市交通 > 行程记录 > 记录统计”,然后单击“新建”新建供应商统计汇总表。在新建汇总表页面,配置如下,配置完成后单击“保存”。

          image.png

          image.png

          1. 返回维度建模页面的“汇总表”标签页后,勾选建好的3个汇总表,单击“发布”。
          2. 在弹出框中选择审核人,单击“确认提交”,等待审核人员审核通过后,汇总表会自动创建。如果当前帐号具备审核人权限,也可以勾选“自助审批”,直接提交即可以审核通过。
          3. 返回“维度建模 > 汇总表”页面,在列表中找到刚发布的汇总表,在“同步状态”一列中可以查看汇总表的同步状态。
          • 如果同步状态均显示成功,则说明汇总表发布成功,汇总表在数据库中已创建成功。
          • 如果同步状态中存在失败,可单击该汇总表所在行的“更多 > 发布历史”,然后在展开的页面中进入“发布日志”页签查看日志。请根据错误日志定位失败原因,问题解决后,您可以在汇总表页面勾选该汇总表,再单击列表上方的“更多 > 同步”尝试重新同步。如果问题仍未能解决,请联系技术支持人员协助处理。
          上一篇 :   使用教程
          下一篇 :  数据开发
          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

           文本反馈
          搜索
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明