searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

天翼云ECS无法访问云监控问题排查

2023-10-30 03:06:40
98
0
  • 检查ECS系统内网卡配置是否正常
    • 检查网卡状态
    • 检查网卡

             

    • 如果网卡state为DOWN,尝试执行ip link set eth0 up
    • 如无法恢复则提工单转技术人员解决
    • 如果网卡状态正常,虚拟机内无IP地址,尝试执行dhclient -i eth0恢复
    • 如无法恢复则先检查网卡配置文件是否配置成dhcp模式获取地址
    • 如步骤6无异常则提工单转技术人员解决获取不到IP地址问题。

 

  • 检查系统内ctcm-agent服务是否正常

           

    • 如服务异常尝试重启服务systemctl restart ctcm-agent。
    • 如重启服务失败,转云监控团队排查。

 

  • 在ECS内进行254.169.254:10051探测
    • curl  169.254.169.254:10051,下图代表通道正常,转云监控团队排查

           

    • 如探测不通则进行后续步骤排查

 

  • 若步骤2探测失败,则进行如下配置排查
    • 查看系统内路由
      • 查看是否存在254.169.254/32或169.254.0.0/16为目的地址的路由

                     

      • 如无254.169.254/32或169.254.0.0/16为目的地址的路由,检查网卡配置文件是否为static模式而非dhcp模式

                     

    • 路由检查正常,则进行路由下一跳地址的ping测试

                     

    • 如路由下一跳地址ping测异常,表明ECS与路由下一跳的网络存在故障,提工单转技术人员解决
    • 如路由下一跳地址ping测正常,表明ECS与路由下一跳的网络正常,需要排查network_node 或 intranel_channel_gateway上的服务端口监听或转发规则是否正常。提工单转技术人员解决
  • 常见问题原因:
    • 客户配置静态IP地址
    • 系统内ctcm-agent服务异常
    • network_node节点nginx服务异常或磁盘占满
0条评论
0 / 1000
于****远
1文章数
0粉丝数
于****远
1 文章 | 0 粉丝
于****远
1文章数
0粉丝数
于****远
1 文章 | 0 粉丝
原创

天翼云ECS无法访问云监控问题排查

2023-10-30 03:06:40
98
0
  • 检查ECS系统内网卡配置是否正常
    • 检查网卡状态
    • 检查网卡

             

    • 如果网卡state为DOWN,尝试执行ip link set eth0 up
    • 如无法恢复则提工单转技术人员解决
    • 如果网卡状态正常,虚拟机内无IP地址,尝试执行dhclient -i eth0恢复
    • 如无法恢复则先检查网卡配置文件是否配置成dhcp模式获取地址
    • 如步骤6无异常则提工单转技术人员解决获取不到IP地址问题。

 

  • 检查系统内ctcm-agent服务是否正常

           

    • 如服务异常尝试重启服务systemctl restart ctcm-agent。
    • 如重启服务失败,转云监控团队排查。

 

  • 在ECS内进行254.169.254:10051探测
    • curl  169.254.169.254:10051,下图代表通道正常,转云监控团队排查

           

    • 如探测不通则进行后续步骤排查

 

  • 若步骤2探测失败,则进行如下配置排查
    • 查看系统内路由
      • 查看是否存在254.169.254/32或169.254.0.0/16为目的地址的路由

                     

      • 如无254.169.254/32或169.254.0.0/16为目的地址的路由,检查网卡配置文件是否为static模式而非dhcp模式

                     

    • 路由检查正常,则进行路由下一跳地址的ping测试

                     

    • 如路由下一跳地址ping测异常,表明ECS与路由下一跳的网络存在故障,提工单转技术人员解决
    • 如路由下一跳地址ping测正常,表明ECS与路由下一跳的网络正常,需要排查network_node 或 intranel_channel_gateway上的服务端口监听或转发规则是否正常。提工单转技术人员解决
  • 常见问题原因:
    • 客户配置静态IP地址
    • 系统内ctcm-agent服务异常
    • network_node节点nginx服务异常或磁盘占满
文章来自个人专栏
文章 | 订阅
0条评论
0 / 1000
请输入你的评论
0
0