中国电信-天翼云,云网融合,安全可信,专享定制

天翼云开发者社区

技术专家布道，交流技术难题，帮助开发者快速成长

我的积分-

积分兑换

精选文章

查看全部

HOTHBase MOB功能设计
本篇文档从功能的需求入手，整理了MOB功能出现之前我们如何利用HBase和HDFS的能力来存储中型文件的思路，再从MOB功能的整体设计入手，分析了读、写、压缩、清理等各个过程执行中可能遇到的问题和应对方式。下一篇我们将从源码入手，对HBase MOB的功能实现进行详细的解读。
陈****赜2024-05-17
HOT无主架构与元数据管理——一致性hash与crush算法解读
本文介绍了一致性哈希算法和CRUSH算法，这两种算法都是用于解决分布式系统中的数据存储和管理问题。该算法通过将服务器和数据映射到一个虚拟的圆环上，确保数据被均匀地分布到各个服务器上，同时在服务器增减时，只影响相邻的数据，从而保证了系统的高容错性和可扩展性。为了避免数据倾斜问题，一致性哈希算法还引入了虚拟节点机制，通过计算多个哈希值来分布数据，使得即使在服务节点较少的情况下也能达到均匀的数据分布。 CRUSH算法是Ceph分布式存储系统中用于数据定位的一种算法，它通过伪随机的路由选择来确定数据应该存储在哪些物理节点上。CRUSH算法考虑了存储节点的物理分布，通过精心设计的哈希函数和规则来选择存储节点，从而实现了数据的高效率和可靠性。CRUSH算法的特点包括计算独立性、稳定性和可预测性，但它也存在一些局限性，比如处理权重失衡的困难、数据迁移问题以及可能导致的使用率不均衡。为了解决这些问题，Ceph从Luminous版本起提供了upmap机制，允许手动指定PG的分布位置，以达到更优的数据均衡效果。
陈****赜2024-05-17

SIMD(Single Instruction Multiple Data) 技术概述
这篇文章主要讨论了SIMD（单指令多数据）技术，它是一种CPU硬件级别的数据并行，在处理大规模数据并行性可以提高计算效率，如数据库算子；讨论了SIMD编程的实现方法和实际应用，以及需要注意的问题。
王****峰2024-05-17
存储协议族一：总览
关于存储相关的协议十分繁杂，对于刚入门存储相关的IT从业者，对于一些名称，如SCSI、NVMe、iSCSI、NFS、CIFS、SMB、RoCE、IB、FC，有些区分不清。早在2016年，EMC的技术大佬Erik Smith就梳理过一张流传很广的协议栈总图，时至今日依然很有参考学习意义。本系列将从这张《Storage Protocols》出发，逐个深入介绍各存储协议栈的情况。
刘****雷2024-05-17
Angular Component class ɵfac 的属性介绍
本文介绍Angular Component class ɵfac 的属性介绍
Jerry2024-05-17
sikuli在测试中的应用
最近负责的软件，新增了一个准入校验的功能，它会检测用户当前的环境是否存在有问题来确定是否能够允许用户进行连接，但是因为服务本身的不稳定，导致经常概率性的出现上一次已经校验通过了，结果再次连接的时候，又提示失败的情况。
z****n2024-05-13

验证Spark进行机器学习与图计算
这个示例的目的是使用Spark的MLlib库进行逻辑回归模型的训练和预测。我们将基于ElasticNet正则化的逻辑回归模型来处理输入数据，并输出模型的系数和截距。ElasticNet是L1（Lasso）和L2（Ridge）正则化的组合，有助于防止模型过拟合。
王****刚2024-05-16
快速上手：TeleDB-FlinkCDC-Doris数据同步
本篇文章为您介绍使用Flink CDC 3.0快速上手构建一条TeleDB-FlinkCDC-Doris数据同步链路
Sirius.2024-05-16
tcpdump工具使用
Tcpdump是一款用于截取网络分组，并过滤输出分组内容的工具，它支持针对网络层、协议、主机、网络或端口的过滤，并提供 and、or、not等逻辑语句来帮助我们去掉无用的信息。
q****n2024-05-15
Vitest组件测试详细流程
本文旨在详细阐述Vue3从0-1接入Vitest单测框架的具体流程，各个依赖包的项目依赖关系的定位，以及单个组件的测试流程。
w****n2024-03-06

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

天翼云开发者社区

活动

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

天翼云开发者社区