prometheus与thanos的大规模监控集群存在性能瓶颈,主要体现在两个方面:一是读写不分离,采集和查询都在prometheus端,线上复杂的查询业务可能打挂prometheus导致数据中断;二是集群不易拆分,单台prometheus采集数据量过大时不容易进行业务数据拆分。 VictoriaMetrics集群版具备分布式的特性,读写分离,容易横向扩展,更适合大规模监控场景。结合当前实际的监控需求,对VM进行高可用性改造,下面将详细介绍改造方案。
天翼云科技有限公司 后端开发工程师
暂未填写个人简介
GO 监控
杭州电子科技大学
共发表过 2 篇文章
文章获得 0 次赞同
文章被浏览 68 次
获得 0 人关注
暂未获得荣誉