活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 618智算钜惠季 爆款云主机2核4G限时秒杀,88元/年起!
  • 免费体验DeepSeek,上天翼云息壤 NEW 新老用户均可免费体验2500万Tokens,限时两周
  • 云上钜惠 HOT 爆款云主机全场特惠,更有万元锦鲤券等你来领!
  • 算力套餐 HOT 让算力触手可及
  • 天翼云脑AOne NEW 连接、保护、办公,All-in-One!
  • 中小企业应用上云专场 产品组合下单即享折上9折起,助力企业快速上云
  • 息壤高校钜惠活动 NEW 天翼云息壤杯高校AI大赛,数款产品享受线上订购超值特惠
  • 天翼云电脑专场 HOT 移动办公新选择,爆款4核8G畅享1年3.5折起,快来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

智算服务

打造统一的产品能力,实现算网调度、训练推理、技术架构、资源管理一体化智算服务
智算云(DeepSeek专区)
科研助手
  • 算力商城
  • 应用商城
  • 开发机
  • 并行计算
算力互联调度平台
  • 应用市场
  • 算力市场
  • 算力调度推荐
一站式智算服务平台
  • 模型广场
  • 体验中心
  • 服务接入
智算一体机
  • 智算一体机
大模型
  • DeepSeek-R1-昇腾版(671B)
  • DeepSeek-R1-英伟达版(671B)
  • DeepSeek-V3-昇腾版(671B)
  • DeepSeek-R1-Distill-Llama-70B
  • DeepSeek-R1-Distill-Qwen-32B
  • Qwen2-72B-Instruct
  • StableDiffusion-V2.1
  • TeleChat-12B

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场创新解决方案
办公协同
  • WPS云文档
  • 安全邮箱
  • EMM手机管家
  • 智能商业平台
财务管理
  • 工资条
  • 税务风控云
企业应用
  • 翼信息化运维服务
  • 翼视频云归档解决方案
工业能源
  • 智慧工厂_生产流程管理解决方案
  • 智慧工地
建站工具
  • SSL证书
  • 新域名服务
网络工具
  • 翼云加速
灾备迁移
  • 云管家2.0
  • 翼备份
资源管理
  • 全栈混合云敏捷版(软件)
  • 全栈混合云敏捷版(一体机)
行业应用
  • 翼电子教室
  • 翼智慧显示一体化解决方案

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
  • 天翼云EasyCoding平台
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼云东升计划
  • 适配中心
  • 东升计划
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
开放能力
  • EasyCoding敏捷开发平台
培训与认证
  • 天翼云学堂
  • 天翼云认证
魔乐社区
  • 魔乐社区

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 建议与反馈
  • 用户体验官
  • 服务保障
  • 客户公告
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 智算服务
  • 产品
  • 解决方案
  • 应用商城
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      分布式消息服务RocketMQ

      分布式消息服务RocketMQ

        • 产品动态
        • 服务公告
        • 2024
        • 【优惠】正式开放2年7折,3年5折包年折扣
        • 【优惠】分布式消息服务RocketMQ增加包年优惠折扣和产品资费下调
        • 【通知】CTGMQ引擎调整为白名单特性
        • 【通知】通用型主机规格调整为白名单特性
        • 产品简介
        • 产品定义
        • 产品优势
        • 功能特性
        • 应用场景
        • 产品规格
        • 开源对比
        • 分布式消息产品选型
        • 使用限制
        • 安全方案
        • 名词解释
        • 产品架构
        • 与其他服务关系
        • 计费说明
        • 产品资费
        • 新资费
        • 旧资费
        • 计费项
        • 计费模式
        • 续费、到期与欠费
        • 退订
        • 快速入门
        • 入门指引
        • 环境准备
        • 创建RocketMQ实例
        • 创建主题和订阅组
        • 创建应用用户和密码
        • 生产消费验证
        • 用户指南
        • 创建实例
        • 实例管理
        • 查看实例
        • 修改实例
        • 连接实例
        • 扩容
        • 按需转包周期
        • 续订和退订
        • 概览
        • 集群信息
        • 标签管理
        • Topic管理
        • 查看Topic
        • 创建Topic
        • 修改Topic
        • 删除Topic
        • 拨测
        • 重置消费位置
        • Topic导入/导出
        • 消费组管理
        • 查看消费组
        • 创建消费组
        • 修改消费组
        • 删除消费组
        • 消费组导入/导出
        • 查看订阅关系
        • 用户权限管理
        • 消息查询
        • 查询消息
        • 消息轨迹
        • 生产者实例查询
        • 消费者实例查询
        • 监控与告警
        • 监控指标说明
        • 集群监控
        • 仪表盘
        • 配置告警
        • 最佳实践
        • 生产者
        • 消费者
        • topic、queue的规划
        • Java客户端Pull和Push的选择:Java客户端必须使用Push Consumer
        • 有序消费和无序消费的选择
        • 消费幂等
        • 业务消息设计:Topic与Tag
        • 同组Consumer订阅关系一致
        • 开发指南
        • 概述
        • 收集连接信息
        • Java
        • 收发普通消息
        • 收发顺序消息
        • 收发事务消息
        • 收发定时/延时消息
        • 消费限流
        • Go
        • 收发普通消息
        • 收发顺序消息
        • 收发事务消息
        • 收发定时/延时消息
        • Python
        • 收发普通消息
        • 收发顺序消息
        • 收发事务消息
        • 收发定时/延时消息
        • 性能白皮书
        • RocketMQ性能白皮书
        • API参考
        • API使用说明
        • SDK参考
        • SDK概述
        • RocketMQ C++ SDK
        • RocketMQ .NET SDK
        • RocketMQ PHP SDK
        • 常见问题
        • 计费类
        • 购买类
        • 操作类
        • 管理类
        • 产品类
        • 相关协议
        • 服务等级协议
        • 服务条款
          无相关产品

          本页目录

          帮助中心分布式消息服务RocketMQ常见问题操作类
          操作类
          更新时间 2024-12-11 10:34:14
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2024-12-11 10:34:14
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接

          服务端异常

          地址冲突,在启动broker时,出现地址已在使用错误

          1.png

          解决方案:修改配置文件里面的listenPort的值,然后重新启动。

          2.png

          brokerName不匹配,启动出现异常:broker-b does not match the expected group name: broker-a

          问题原因:启动其他Master broker服务时,直接将之前使用过的store目录以及bdb目录复制过来,仅仅只是修改了brokerName,导致此问题出现。

          解决方案:2.0以后版本brokerName一旦创建启动后就不能改变,否则只能删除store目录才能解决。

          service not available

          发送消息一定量的时候,出现 create maped file failed, please make sure OS and JDK both 64bit。或者当topic的队列数位1024个的时候,会出现service not available now, maybe disk full,maybe your broker machine memory too small。

          解决方案:使用ulimit-a命令查询系统参数,检查open files是否超过655350,max memory size是为否unlimited,若不是,需要重新根据安装手册的步骤,重新调整系统参数。

          3.png

          磁盘空间不足

          当磁盘空间大于85%时,会出现“ CODE: 14 DESC: service not available now, maybe disk full, CL: 0.87 CQ: 0.87 INDEX: 0.87, maybe your broker machine memory too small.”的异常。

          解决方案:消息中间件有两种策略, 包括数据高安全性与服务高可靠性,分别如下:

          策略 配置 说明
          数据高安全性 cleanFileForciblyEnable=false 若磁盘使用率大于85%,有消息生产时或默认凌晨四点,则触发删除过期的消息,若没过期消息则不会被删除
          服务高可靠性 cleanFileForciblyEnable=true 若磁盘使用率大于85%,有消息生产时或默认凌晨四点,则触发删除消息(在有效期内的数据将被删除)

          若磁盘使用率大于85%,策略为数据高安全性,且无过期文件,可以按实际需求,减少数据保存时间来触发消息删除,腾出磁盘空间。

          • 使用updateBrokerConfig命令,修改fileReservedTime属性,此属性为消息保存时间,单位为小时。按需减少保存时间,则可以腾出磁盘空间。
          • 主备都需要同时修改。

          通过deamon拉起broker时报错

          deamon.log日志中报Fail to queryBrokerMaxOffset。

          5.png

          问题原因:

          • 配置文件错误。
          • 做过主备切换,然后手动干预或重启集群,启动进程的地址和角色与zookeeper中存储的不同,造成启动失败。
          • 上次启动失败后未清理错误数据。

          解决方法:

          • 删除zk中该集群的信息。
          • 核对配置文件,确保端口和路径有效。

          删除running目录。

          • 重新通过自动部署或者手动部署启动进程。

          消费进度停滞不前

          通过consumerProgress命令查询消费进度某些队列无变化,而客户端正在正常消费。

          问题原因:某些队列有消息没有签收,导致服务端消费进度没有后移。

          解决方案:通过consumerProgress命令显示的consumer offset找到对应消息,并按如下判断执行:

          • 如果是BDB消费模式,重启应用即可或者通过以下api void com.ctg.mq.api.IMQAckHandler.ackMessageSuccess(String msgID)签收卡住的消息即可。
          • 如果是原生有序消费模式,重启应用即可。
          • 如果是原生无序消费模式,启动一个同消费组的实例,会将该消息签收。

          删除topic失败

          删除topic时出现topic **** is consuming by consumer ****,或者topic *** is publishing by producer ***异常。

          问题原因:删除topic必须没有生产者和消费者正在订阅该topic(与该topic相关的生产者消费者都必须离线),否则会失败。

          解决方案:

          • 可以通过一下方式查看是否还有客户端连接该topic:管理平台->主题管理->详情->生产组|消费组->连接实例。
          • 如果使用命令行删除有序队列,需要使用集群删除,例如:sh mqadmin deleteTopic -n 10.142.90.33:9876 -c mq_cluster -t mytesttopic。
          • 如果使用命令行删除无序队列,可以使用broker删除,例如:sh mqadmin deleteTopic -n 10.142.90.33:9876 -b 10.142.90.33:10911 -t mytesttopic。

          启动broker时BDB报错

          6.png

          问题原因:可能是迁移了store目录或者更换了broker的组名、地址或端口。

          解决方案:删除store目录下的consumeStore目录,重启broker即可解决。

          从broker已启动,但clusterList看不到

          从broker已启动,但无法加入到集群(clusterList查询不到)。

          问题原因:

          • 查看/etc/hosts文件,机器名与IP的映射关系是否填写有误。
          • 查看防火墙设置(是否有端口未开放),listenPort 到 listenPort+2的端口都 需要开放(如果主broker的listenPort=10911,那么10911、10912、10913都要开放)。

          通过命令行创建有序topic,但是web管理台显示的是无序的

          通过updateTopic命令,加-o true创建有序topic,但是web端查询的时候 显示是无序的。

          问题原因:集群有多个namesrv,但是创建的时候只填了一个namesrv。

          解决方案:创建时加上这个broker集群的所有namesrv,中间用分号分割,例如:sh mqadmin updateTopic -n “10.142.90.30:9876;10.142.90.28:9876”-t crmTopic -o true。

          消费者订阅关系不存在

          broker.log日志报错:the consumer's subscription not exist, group: consumerAepIdealLogGroup。

          7.png

          问题原因:使用同个订阅组,同时消费不同的topic,订阅关系会被覆盖。

          解决方案:不能使用同个订阅组的消费组去订阅不同的topic,如果需要变换订阅关系,请关闭旧消费者。

          使用clusterList查询 主TPS不为0,从TPS一直为0

          这种情况最大的可能是从同步出错,可以做进一步的确认,查看store.log或者 stoererror.log,一般会看到有持续的报错信息。这种情况可以删除从的store目录,重新进行同步。

          注意:部署有高可用模块或者主的brokerRole=ASYNC_MASTER,否则停止从的时候,生产会报错。

          解决方案:

          • 手工停止从broker(kill pid,注意不要加-9,如果自动拉起broker参数设置为true,则需要先关掉从的deamon)。
          • 删除或者备份从的store目录(为保险起见,空间允许的话,可以mv备份,不要直接删除。
          • 手工启动broker(sh sh/broker_*.sh)。
          • 从broker启动完成后,用clusterList查看,可以看到从的TPS比较高,因为正在同步。

          主broker异常恢复

          需要走异常恢复流程的一般是consumequeue生成有问题,导致无法拉取消息(注意 有多种情况会导致无法拉取消息,不一定是consumequeue有问题,注意判断)、根据offset查询报错。

          异常恢复流程:

          1.停止需要恢复这一组broker的主从deamon,主从broker。

          2.删除主broker store目录下的checkpoint consumequeue consumeStore index(也可以mv 改下名字来备份)。

          3.检查store目录下的abort文存是否存在,如果不存在新建一个(touch abort)。

          4.启动主broker,查看store.log,可以看到打印恢复过程的日志,如果没有报错,说明恢复成功。

          5.如果commitlog文件比较多,可能恢复时间较长,可以通过查看store.log或者broker端口是否起来判断恢复是否完成。

          6.主broker起来后,通过消费或者根据offset查询消息来验证是否恢复成功。

          7.如果主broker恢复成功,启动从broker,启动主从deamon。

          RPC异常(所以服务端组件均可能出现)

          8.png

          问题原因:使用非组件RPC协议访问导致,比如用http协议、或者telnet等,均可导致decode错误。

          解决方案:无需解决,应服务端及客户端RPC请求均无影响。

          应用客户端

          连接拒绝Connect faild

          11.png

          解决方案:当出现这类问题时,检查当前网络并无异常时,并排查下ulimit –a openfiles是否为1024,修改至65535。

          超时异常RemotingTimeoutException

          服务器端日志出现RemotingTimeoutException:wait response on the channel < 10.4.246.198:10911 > timeout, 3000ms。

          解决方案:这类情况一般由于客户端与服务端通信出现问题,可以ping Ip 以及telnet ip port 来排查这类,同时也要检查防火墙的问题。

          找不到路由No route info of this topic

          问题可能原因:

          • 没创建topic。
          • name server填错了。
          • 网络问题无法获取路由。

          解决方案:

          • 在管理台创建topic。
          • 检查客户端配置的namesrv的地址是否配错了。
          • 检查网络是否正常。

          备不可用SLAVE_NOT_AVAILABLE

          当生产者发送消息时,出现“status:SLAVE_NOT_AVAILABLE”,说明从节点发生状况。

          解决方案:

          • 从节点机器出现问题,重启从节点,并查看网络连接。
          • 在多网卡情况下,broker配置文件properties中,需增加配置项,例如:brokerIP1=10.4.246.130,brokerIP2=10.4.246.130
          • 防止网卡ip读取错误,取不到从节点信息。

          消息体大小越界

          客户端报此类异常Fail to send message, for: message body size over max message size, max: 524288。

          解决方案:

          • 检查服务端的最大消息体大小,即启动broker配置文件的maxMessageSize大小,如未配置,默认是512K。
          • 检查客户端设置的最大消息体(默认128k)是否小于当前发送的消息体大小。

          注意:ROCKETMQ建议消息体在50K或以下(压缩后)。

          组名已经创建

          当消息生产端/消费端运行时,报错The producer/consumer group has been created。

          问题原因:在同一个jvm里面只允许一个producerGroupName被加载一次 (consumerGroupName同理),否则就会报错。

          解决方案:

          • 如果使用同一个producerGroupName,部署多个实例(起多个进程)。
          • 在一个进程里,起多个线程,共用一个Producer对象实例。

          Subscription group not exist或者抛出%retry%的topic没有路由信息

          问题原因:没有建立消费关系或者没有创建相关订阅组。

          解决方案:在管理台或命令行创建对应订阅组。

          Messgae already acked,ackMessage failed

          88.png

          解决方案:这种异常表明该消息已被签收,直接跳过即可。

          重试签收调用次数

          ackMessageRetry重试签收是只需要调一次就够了,还是需要调多次。例如:签收失败后,调用重试签收,如果重试签收也失败,是否需要再次调用重试签收,还是会自动重试签收。

          现有版本接口不会自动帮你重试签收的, 重试签收失败后,需要自己再次调用重试签收接口。

          签收时出现不确定异常,如发生超时,或者网络异常时,是需要应用判断消息是否已经签收成功

          解决方案:

          • 通过管理台“即时查询”模块,查询这消息是否已经签收成功,看结果再做处理。
          • 重试签收,如果已经签收会抛已签收异常。主要还是看应用的自己处理。

          客户端注册失败

          客户端日志报No matched consumer for the PullRequest PullRequest。

          1111.png

          问题原因:客户端实例注册失败。

          解决方案:检查客户端代码,重启客户端进程。

          the consumer message buffer is full, so do flow control

          客户端日志出现the consumer message buffer is full, so do flow control

          问题原因:push客户端消费过慢,本地缓存队列已满,暂时停止向服务端拉取消息。消费慢的原因可能是网络原因、topic队列数过多、消费者过少,内存过小等。

          解决方案:

          (1)查看网络是否异常,缓慢。

          (2)增加消费者实例。

          (3)如果消息不重要,又不方便增加消费者实例,可以减少topic队列数量。

          system busy, start flow control for a while

          客户端日志出现 [REJECTREQUEST]system busy, start flow control for a while 或者 [PCBUSY_CLEAN_QUEUE]broker busy, start flow control for a while, period in queue。

          问题原因:

          • 在关闭生产者实例的同时用生产者实例发送消息,连接关闭了netty会拒绝请求。
          • 线程少,处理发送请求过慢。

          解决方案:

          • 应用优化使用流程,禁止在close生产者实例后使用生产者。
          • 如果Broker是同步主,那么改成异步主,或者将 sendMessageThreadPoolNums=32且waitTimeMillsInSendQueue=1000。

          消费者消费不到消息如何处理

          进入控制台查看订阅管理菜单,检查订阅组是否有消费实例在线,如果不在线检查消费客户端日志是否有连接异常。

          检查消费客户端逻辑,是否存在订阅关系不一致的情况。

          消费者机器宕机重启是否会造成消息丢失

          RocketMQ的消息数据以及订阅信息都是持久化保存的,当消费者下线重新上线后,会Broker持久化的下线前的消费偏移重新开始消费,所以不会发生消息丢失的情况。

          订阅消息时是否可以允许消息Tag为空

          订阅主题时如果Tag设置为空会导致消费者消费不到消息,如不希望通过Tag进行消息过滤,可以将Tag设置为*,示例如下:

          consumer.subscribe(topic, "*");

          客户端连接时出现“signature validate by dauth failed”错误

          这种错误的原因一般是由于ACL认证失败,较大的可能是客户端配置的AccessKey和SecretKey出现错误,可以检查下这两项配置是否输入有误。

          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  购买类
          下一篇 :  管理类
          搜索 关闭
          ©2025 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2025天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明