searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

分布式数据库数据重分布介绍

2023-09-26 02:16:38
648
0

前提概念

GTM、CN、DN概念

  • Coordinator:协调节点(简称CN),对外提供接口,负责数据的分发和查询规划。多个节点位置对等,每个节点都提供相同的数据库视图;在功能上CN上只存储系统的全局元数据,并不存储实际的业务数据
  • Datanode:用于处理存储本节点相关的元数据,每个节点还存储业务数据的分片,简称DN。在功能上,DN节点负责完成执行协调节点分发的执行请求。
  • GTM全局事务管理器(Global transactionmanager.),主要是做分布式事务,负责管理集群事务信息,同时管理集群的全局对象,比如序列等,除此之外GTM上不提供其他的功能。

shard(普通表、分区表、冷热分区表)、复制表

shard普通表

建表时指定分布列与存储组,如果没有指定分布列则使用主键做分布列,否则默认第一个字段,使用distribute by 使用的是哈希分布,具有相同哈希值的数据会分布在同一节点。分布方式还有DISTRIBUTED RANDOMLY以及DISTRIBUTED REPLICATED。
 
  因为具有相同哈希值的数据是存储在同一个节点上的,所以在查询f1=3的数据时,只会在DN2上进行查询。

shard分区表

  可以看到拥有同样字段值的内容根据时间已经分成了不同的子表,但是都存在DN1上。分区表的优点是如果你的查询带有时间的话,它很好的利用数据库分区剪枝的特性,它只查询其中的某一个分区,这样就减少了查询的数据量,提升了性能。

shard冷热分区表

  进行冷热分区以后可以将热点数据存储在较好的存储设备,将更多的冷数据存储在相对廉价的设备从而节约成本,做到性能与成本的兼顾。

复制表

复制表是指所有节点均拥有全量的数据,主要的使用场景是更新较少、经常参与join的小表,如果要是频繁的进行更新,就不适合用复制表
0条评论
0 / 1000
c****n
3文章数
0粉丝数
c****n
3 文章 | 0 粉丝
原创

分布式数据库数据重分布介绍

2023-09-26 02:16:38
648
0

前提概念

GTM、CN、DN概念

  • Coordinator:协调节点(简称CN),对外提供接口,负责数据的分发和查询规划。多个节点位置对等,每个节点都提供相同的数据库视图;在功能上CN上只存储系统的全局元数据,并不存储实际的业务数据
  • Datanode:用于处理存储本节点相关的元数据,每个节点还存储业务数据的分片,简称DN。在功能上,DN节点负责完成执行协调节点分发的执行请求。
  • GTM全局事务管理器(Global transactionmanager.),主要是做分布式事务,负责管理集群事务信息,同时管理集群的全局对象,比如序列等,除此之外GTM上不提供其他的功能。

shard(普通表、分区表、冷热分区表)、复制表

shard普通表

建表时指定分布列与存储组,如果没有指定分布列则使用主键做分布列,否则默认第一个字段,使用distribute by 使用的是哈希分布,具有相同哈希值的数据会分布在同一节点。分布方式还有DISTRIBUTED RANDOMLY以及DISTRIBUTED REPLICATED。
 
  因为具有相同哈希值的数据是存储在同一个节点上的,所以在查询f1=3的数据时,只会在DN2上进行查询。

shard分区表

  可以看到拥有同样字段值的内容根据时间已经分成了不同的子表,但是都存在DN1上。分区表的优点是如果你的查询带有时间的话,它很好的利用数据库分区剪枝的特性,它只查询其中的某一个分区,这样就减少了查询的数据量,提升了性能。

shard冷热分区表

  进行冷热分区以后可以将热点数据存储在较好的存储设备,将更多的冷数据存储在相对廉价的设备从而节约成本,做到性能与成本的兼顾。

复制表

复制表是指所有节点均拥有全量的数据,主要的使用场景是更新较少、经常参与join的小表,如果要是频繁的进行更新,就不适合用复制表
文章来自个人专栏
文章 | 订阅
0条评论
0 / 1000
请输入你的评论
0
0