SQL模板下TPC-H样例数据说明 本章节主要介绍数据湖探索服务SQL模板下TPCH样例数据说明。 TPCH样例数据简介 TPCH(商业智能计算测试)是美国交易处理效能委员会(TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前,在学术界和工业界普遍用来评价决策支持技术方面应用的性能。这种商业测试可以全方位评测系统的整体商业计算综合能力,对厂商的要求更高,同时也具有普遍的商业实用意义,目前在银行信贷分析和信用卡分析、电信运营分析、税收分析、烟草行业决策分析中都有广泛的应用。 TPCH 基准测试是由 TPCD(由 TPC 组织于 1994 年指定的标准,用于决策支持系统方面的测试基准)发展而来的。TPCH用3NF实现了一个数据仓库,共包含8个基本关系,其数据量可以设定从1G3T不等。TPCH 基准测试包括 22 个查询(Q1Q22),其主要评价指标是各个查询的响应时间,即从提交查询到结果返回所需时间。TPCH基准测试的度量单位是每小时执行的查询数( QphH@size),其中“H”表示每小时系统执行复杂查询的平均次数,“size”表示数据库规模的大小,能够反映出系统在处理查询时的能力。TPCH 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之,TPC组织颁布的TPCH 标准满足了数据仓库领域的测试需求,并且促使各个厂商以及研究机构将该项技术推向极限。 本示例将演示DLI直接对存储在OBS中的TPCH数据集进行查询的操作,DLI已经预先生成了100M的TPCH2.18的标准数据集,已将数据集上传到了OBS的tpch文件夹中,并且赋予了只读访问权限,方便用户进行查询操作。