表类型 DWS连接类型的表支持以下表类型:DWS_ROW:行存表。行存储是指将表按行存储到硬盘分区上。DWS_COLUMN:列存表。列存储是指将表按列存储到硬盘分区上。MRS_HIVE仅支持HIVE_TABLE类型。 DISTRIBUTE BY 该参数仅DWS连接类型有效。DWS表当前支持复制(Replication)和散列(Hash)两种分布策略。用户可选取多个字段。REPLICATION方式:在每一个DN节点上存储一份全量表数据。
在内存受限的环境中这可能会有用,这种环境中被输入到大型排序操作中的元组具有很强的物理逻辑关联。注意,这不包括具有逆相关的输入元组。替换选择算法可能会产生一次不需要合并的长时间运行,其中使用默认策略会导致很多次运行并且必须被合并来产生最终的有序输出。这可以允许排序操作更快完成。默认是150,000 个元组。注意,更高的值通常不会更有效,并且可能产生反效果,因为优先队列对于可用的 CPU 高速缓存的尺寸很敏感,然而默认策略会使用一种高速缓存透明算法运行。