天翼云数据湖构建：OOS+Iceberg+Trino统一查询架构实战-天翼云开发者社区

引言

当企业数据从TB级迈向PB级，传统数仓的瓶颈便不再是"存不下"，而是"查不动"。数据散落在业务库、日志系统、消息队列中，形成一座座信息孤岛——想做一张跨域报表，需要把数据从五六个系统里抽取出来、清洗对齐、再灌入数仓，整个链路跑下来，业务需求早已过期。数据湖的出现，本质上是为了打破这道墙：把所有原始数据统一 dumped 进一个低成本存储池，再用统一的查询引擎按需取用。但"建湖"容易，"用好湖"才是真本事。没有合理的表格式，数据湖就是一片沼泽；没有高效的查询引擎，数据湖就是一座死库。天翼云基于对象存储服务OOS、Apache Iceberg表格式与Trino查询引擎构建的统一查询架构，正是为了解决这两个核心命题：让数据湖既"存得稳"又"查得快"。本文将从架构设计、核心组件选型、性能优化到实战落地，完整拆解这套湖仓一体方案的构建路径。

一、为什么是Iceberg：数据湖的"地基"必须选对

在讨论架构之前，必须先回答一个根本问题：数据湖用什么表格式？Hive表？Delta Lake？还是Apache Iceberg？

传统Hive表的痛点人尽皆知：不支持ACID事务，写入一半失败就会产生脏数据；不支持行级更新和删除，想改一条记录只能重写整个分区；没有时间旅行能力，数据出错无法回滚；小文件问题靠手动合并，运维成本极高。这些问题在TB级场景下尚可忍受，到了PB级就是灾难。

Iceberg的出现，正是为了填补这块短板。它采用三层元数据架构——最底层是Manifest List，记录每个快照包含的所有Manifest File；中间层是Manifest File，记录每个分区下Data File的路径与统计信息；最上层是Metadata File，记录表的Schema、分区、快照历史。这套架构带来了五个核心能力：

第一，ACID事务保障。 Iceberg通过乐观并发控制实现原子性提交——写入要么全成功，要么全回滚，下游永远不会读到中间状态的脏数据。

第二，时间旅行查询。 每次提交生成一个快照，所有历史版本都被完整保留。业务出错时，一条SQL就能回滚到任意时间点的数据状态，无需手动备份。

第三，Schema与分区演进。 添加字段、删除字段、修改分区策略，都不需要重写历史数据。这在业务快速迭代的场景下价值巨大——表结构可以跟着业务一起进化，而不是成为拖后腿的包袱。

第四，隐藏分区。 查询时无需显式指定分区键，Iceberg的元数据层会自动完成数据文件过滤。业务SQL保持简洁，存储层持续优化，两者互不干扰。

第五，小文件自动合并。 Iceberg原生支持Compaction Service，后台自动将碎片化的小文件合并为大文件，对查询透明，彻底告别手动运维。

正是这些特性，让Iceberg成为天翼云数据湖架构的表格式首选。

二、OOS：数据湖的"仓库"

表格式解决了"数据怎么组织"的问题，存储层则解决"数据放在哪里"的问题。天翼云对象存储服务OOS，正是这套架构的存储底座。

OOS提供海量、低成本、高可靠的对象存储能力，兼容S3 API，这意味着所有支持S3协议的计算引擎都可以直接读写，无需额外适配。在湖仓一体架构中，OOS承担两个角色：一是Iceberg表的数据文件（Parquet/ORC格式）的持久化存储，二是Trino查询过程中的中间结果缓存。

为什么不用HDFS？在PB级场景下，对象存储的弹性扩展能力远超HDFS。OOS可以按需扩容，不存在NameNode瓶颈，也不需要担心存储节点扩容时的数据迁移问题。更关键的是，OOS与Iceberg的配合天然顺畅——Iceberg的元数据文件本身就是小文件，存放在OOS中可以避免HDFS NameNode的压力；而数据文件以Parquet格式存储在OOS上，Trino可以直接通过S3协议并行读取，无需经过额外的数据搬运。

三、Trino：统一查询的"大脑"

如果说OOS是仓库、Iceberg是货架管理系统，那么Trino就是那个能同时查阅所有货架的超级管理员。

Trino是一款开源的分布式SQL查询引擎，专为跨数据源的即席查询而设计。它最大的优势在于：不搬运数据，只搬运查询。无论数据存在OOS上的Iceberg表中，还是存在其他数据源里，Trino都可以用标准SQL语法直接查询，无需数据迁移或ETL中转。

在天翼云的湖仓一体架构中，Trino通过Iceberg连接器直接读取OOS上的Iceberg表数据。配置过程极为简洁——只需在Trino的catalog目录下创建Iceberg配置文件，指定OOS的访问端点和Hive Metastore地址，重启后即可开始查询。Trino的Iceberg连接器完整支持DDL和DML操作，包括建表、插入、时间旅行查询、隐藏分区等高级功能。

更重要的是，Trino不只支持Iceberg。它同时支持Delta Lake、Apache Hudi等主流数据湖格式，这意味着天翼云的数据湖可以容纳多种表格式，而Trino作为统一查询层，对上层应用完全透明。业务方只需要写SQL，不需要关心数据到底存在哪种格式里。

四、架构设计：三层解耦，各司其职

天翼云OOS+Iceberg+Trino的湖仓一体架构，采用经典的三层解耦设计：

存储层（OOS）：存放Iceberg表的数据文件（Parquet/ORC）和元数据文件。数据文件按分区组织，支持生命周期管理——热数据存放在标准存储，冷数据自动沉降到低频存储，成本可控。

表格式层（Iceberg）：负责数据的组织、管理和事务保障。所有数据以Iceberg表的形式存在OOS上，享受ACID事务、时间旅行、Schema演进等能力。元数据通过Hive Metastore统一管理，支持多引擎并发读写。

查询层（Trino）：作为统一SQL入口，对接所有Iceberg表。支持即席查询、报表分析、数据探索等多种场景。Trino的分布式执行引擎可以将一个复杂查询拆分为多个子任务，并行扫描OOS上的数据文件，查询性能随节点数线性提升。

这三层之间完全解耦：存储可以独立扩容，表格式可以自由切换，查询引擎可以按需弹性伸缩。任何一层的升级都不会影响其他层，这正是湖仓一体架构的核心价值。

五、性能优化：让PB级查询跑出秒级响应

架构搭好只是第一步，真正的挑战在于性能。在PB级数据湖上做查询，如果不做优化，一个简单的聚合查询可能要跑几十分钟。天翼云在实战中总结出了一套行之有效的优化体系。

优化一：延迟物化（Late Materialization）。 这是Iceberg与Trino配合的杀手级优化。以一个包含五个字段的查询为例：如果没有延迟物化，系统会把五列数据全部读出后再做条件过滤；开启延迟物化后，系统先只读取过滤条件涉及的列，用过滤后的行号再去读取剩余列。在谓词过滤率较高的场景下，IO请求量可以从几百GB降至几百MB，网络带宽压力骤降，查询性能提升数倍。天翼云与开源社区合作完成了复杂类型（Array、Map、Struct）的延迟物化功能，覆盖了绝大多数业务场景。

优化二：Z-Order多维聚类索引。 对于多条件过滤查询，传统的分区裁剪只能过滤一个维度，其余维度仍需全表扫描。Z-Order索引通过多维空间填充曲线对数据进行重分布，使得多个过滤条件同时生效。实测数据显示，在电商用户行为分析场景中，启用Z-Order索引后，扫描数据量从1.2TB降至78GB，查询执行时间从127秒降至3.8秒，降幅高达97%。

优化三：小文件治理。 实时写入场景下，Flink分钟级写入会产生大量小文件，导致NameNode压力大、扫描效率低。天翼云通过Compaction Service自动合并小文件，Expiration Service清理过期快照和孤儿文件，Cluster Service对数据进行重分布。这套治理服务独立运行，不影响实时写入性能，同时保证查询层始终面对的是优化后的大文件。

优化四：统计信息驱动的查询计划优化。 Trino在执行查询前会分析Iceberg表的统计信息（最小值、最大值、空值计数），自动跳过不满足条件的数据文件。建议每日执行ANALYZE命令更新统计信息，确保查询计划始终基于最新的数据分布。

六、实战落地：从架构到业务的最后一公里

天翼云的湖仓一体架构已在多个核心业务场景中落地验证。在实时报表与多维分析场景中，Trino替代了原有的Impala+Redis架构，查询响应时间控制在0.4秒至0.7秒，报表生成周期大幅缩短。在日志存储分析场景中，Trino直接查询Iceberg表中的日志数据，写入吞吐提升5倍，存储成本降低80%，百亿级日志检索实现秒级响应。在物联网数据分析场景中，通过合理的分区分桶规划和强大的数据索引，Trino实现了平均QPS 8000、峰值QPS 15000的并发查询能力。

更值得一提的是Iceberg表的写回能力。天翼云与开源社区合作，实现了Trino对Iceberg表的写回功能——分析结果不仅可以查询，还可以直接写回Iceberg表，供其他引擎或业务共享。这让数据湖真正实现了"读写一体"，而不仅仅是一个只进不出的数据黑洞。

结语

数据湖的价值，不在于你存了多少数据，而在于你能多快地从数据中榨出答案。OOS提供了弹性无限的存储底座，Iceberg赋予了数据湖事务级的可靠性与灵活性，Trino则让PB级数据的查询从"不可能"变成"秒级响应"。天翼云这套OOS+Iceberg+Trino的统一查询架构，本质上是用三个开源技术组件，构建了一套企业级的湖仓一体解决方案——没有厂商绑定，没有黑盒组件，每一层都可替换、可升级、可演进。当数据不再是孤岛，当查询不再需要等待，数据湖才真正从"能用"走向了"好用"。

引言

一、为什么是Iceberg：数据湖的"地基"必须选对

在讨论架构之前，必须先回答一个根本问题：数据湖用什么表格式？Hive表？Delta Lake？还是Apache Iceberg？

第一，ACID事务保障。 Iceberg通过乐观并发控制实现原子性提交——写入要么全成功，要么全回滚，下游永远不会读到中间状态的脏数据。

第四，隐藏分区。 查询时无需显式指定分区键，Iceberg的元数据层会自动完成数据文件过滤。业务SQL保持简洁，存储层持续优化，两者互不干扰。

第五，小文件自动合并。 Iceberg原生支持Compaction Service，后台自动将碎片化的小文件合并为大文件，对查询透明，彻底告别手动运维。

正是这些特性，让Iceberg成为天翼云数据湖架构的表格式首选。

二、OOS：数据湖的"仓库"

表格式解决了"数据怎么组织"的问题，存储层则解决"数据放在哪里"的问题。天翼云对象存储服务OOS，正是这套架构的存储底座。

三、Trino：统一查询的"大脑"

如果说OOS是仓库、Iceberg是货架管理系统，那么Trino就是那个能同时查阅所有货架的超级管理员。

四、架构设计：三层解耦，各司其职

天翼云OOS+Iceberg+Trino的湖仓一体架构，采用经典的三层解耦设计：

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

天翼云数据湖构建：OOS+Iceberg+Trino统一查询架构实战

引言

一、为什么是Iceberg：数据湖的"地基"必须选对

二、OOS：数据湖的"仓库"

三、Trino：统一查询的"大脑"

四、架构设计：三层解耦，各司其职

五、性能优化：让PB级查询跑出秒级响应

六、实战落地：从架构到业务的最后一公里

结语

天翼云数据湖构建：OOS+Iceberg+Trino统一查询架构实战

引言

一、为什么是Iceberg：数据湖的"地基"必须选对

二、OOS：数据湖的"仓库"

三、Trino：统一查询的"大脑"

四、架构设计：三层解耦，各司其职

五、性能优化：让PB级查询跑出秒级响应

六、实战落地：从架构到业务的最后一公里

结语

活动

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

天翼云数据湖构建：OOS+Iceberg+Trino统一查询架构实战

引言

一、为什么是Iceberg：数据湖的"地基"必须选对

二、OOS：数据湖的"仓库"

三、Trino：统一查询的"大脑"

四、架构设计：三层解耦，各司其职

五、性能优化：让PB级查询跑出秒级响应

六、实战落地：从架构到业务的最后一公里

结语

天翼云数据湖构建：OOS+Iceberg+Trino统一查询架构实战

引言

一、为什么是Iceberg：数据湖的"地基"必须选对

二、OOS：数据湖的"仓库"

三、Trino：统一查询的"大脑"

四、架构设计：三层解耦，各司其职

五、性能优化：让PB级查询跑出秒级响应

六、实战落地：从架构到业务的最后一公里

结语