专栏
天翼云开发者社区

CDN业务访问失败!怎么破?

2022-12-16 12:26:29 523阅读

 

前言:当前互联网大部分业务都会使用CDN加速产品来提升业务的访问效率,但是对于互联网公司来说,CDN内部就是个黑盒子(不知其内部运作方式或工作状态),当业务经CDN访问出现问题时,除了等待CDN对业务进行分析排查,我们有没有更快的手段来对业务进行恢复呢?今天我们简单来讨论下,当业务出现故障时,我们要如何快速定位并恢复业务。

CDN加速业务架构大致如下图,可以分为三大模块:

模块1、实际用户

模块2、CDN加速

模块3、服务源站

一、定位问题

当业务访问出现异常时,我们首先需要先定位下,业务是在上面哪个模块出现异常?

1、模块1用户侧异常:这类异常一般是用户自身使用环境问题(APP版本,用户网络)——定位这类问题,可以先通过模拟复现异常的访问情况,来确定是否是部分用户自身的问题。

2、模块2 CDN加速异常与模块3源站问题:在收到用户报障后,如果排除第一种情况(问题可以复现,且非单用户问题),我们可以通过对比测试来定位问题是在CDN侧还是源站侧——通过对比访问源站及CDN域名,来定位问题模块。

对比访问方式

假设访问出现异常的URL为:http://www.domain.com/1.jpg,源站服务器IP为:111.111.111.111

1)、访问CDN URL:http://www.domain.com/1.jpg

2)、访问源站 URL:http://111.111.111.111/1.jpg

我们可以通过上面两条访问URL的结果来进行对比:如果源站访问是正常的,但CDN访问是异常的,则定位模块2(CDN加速)出现问题;否则,则是模块3(源站)出现异常(因为源站出现异常,必然也导致CDN加速也出现异常)

注:如果是非单页面出现异常,可以在host文件中,配置指定域名直接指向源站,来进行源站访问对比测试。在HOST文件(HOST文件地址:C:\Windows\System32\drivers\etc\hosts)最后空白处新增一行内容如下,:

源站IP   访问域名

来配置访问域名时,绕过CDN,直接访问源站,如在本例中,增加:

111.111.111.111 www.domain.com

并保存文件,之后我们通过浏览器访问:http://www.domain.com/1.jpg,就会绕过CDN,直接访问源站了(可以用于对比测试是否源站出现问题),记得测试完,需要回到HOST文件,把这行再删除哦~

二、解决问题:优先恢复业务

在定位完问题后,我们就需要考虑如何快速恢复业务了:

1、针对模块1(用户侧)出现的问题,需要根据用户环境进行分析,这类情况影响面一般比较小,而且各情况不尽相同,这里就不展开了(其实是无法展开-_-!!)

2、针对模块2(CDN侧)出现的问题:需要动动手,收集一些信息。这里,我以访问http://www.sina.com.cn/favicon.ico为例,给大家截图展示下对应的信息收集过程,

    1)、准备好信息收集的环境:先打开浏览器,在浏览器界面中按下 F12 ,打开【开发者人员工具】,然后选择network(网络);

     2)、模拟访问,收集信息:再进行异常页面访问,并找到或过滤到异常的URL,点击后,可以找到对应的【标头】信息,将访问的【标头】信息收集起来(可以简单粗暴的将所有信息都截图起来),并反馈给CDN厂商,让CDN厂商及时进行解决;

3、针对模块3(源站)出现的问题:如果明确是源站出现的问题,则需要及时对源站发布的内容进行调整,调整完成后,再进行对外发布。另外,很重要的一点!!!如果原来CDN中针对异常访问的URL有缓存了,那么在源站发布新文件后,一定要到CDN控制台上,针对异常URL进行【内容刷新】,以天翼云CDN控制台为例(入口:https://cdn.ctyun.cn/),刷新操作界面,如下图:

        目的就是将原来缓存在CDN上的异常内容删除掉(目前各厂商CDN控制台上都有这一功能),不然,虽然源站发布了新内容,但是实际用户还是可能访问到CDN缓存的异常内容的哦~

三、反思:业务高可用规划

        另外,针对CDN模块的问题,在条件允许的情况下,建议在平日运营中,将业务分量跑在不同的CDN厂商,这样,在任意一个CDN厂商出现问题情况下,可以通过切换域名DNS解析的方式,快速将业务调整至稳定运行的CDN厂家,待CDN问题解决后,再恢复分量调度模式,从业务架构上达到高可用的方案

        做为业务运营方,我们即使不知道CDN具体的运作情况,但是也可以通过以上简单问题定位原则及对应的问题恢复手段,达到保障业务稳定的目的。另外,有条件的话,平日运营工作中,一定要把业务高可用规划给安排起来哦~~

 

  • 2
  • 0
  • 0
0 评论
0/1000
评论(0) 发表评论
林****铠

林****铠

2 篇文章 1 粉丝
关注

CDN业务访问失败!怎么破?

2022-12-16 12:26:29 523阅读

 

前言:当前互联网大部分业务都会使用CDN加速产品来提升业务的访问效率,但是对于互联网公司来说,CDN内部就是个黑盒子(不知其内部运作方式或工作状态),当业务经CDN访问出现问题时,除了等待CDN对业务进行分析排查,我们有没有更快的手段来对业务进行恢复呢?今天我们简单来讨论下,当业务出现故障时,我们要如何快速定位并恢复业务。

CDN加速业务架构大致如下图,可以分为三大模块:

模块1、实际用户

模块2、CDN加速

模块3、服务源站

一、定位问题

当业务访问出现异常时,我们首先需要先定位下,业务是在上面哪个模块出现异常?

1、模块1用户侧异常:这类异常一般是用户自身使用环境问题(APP版本,用户网络)——定位这类问题,可以先通过模拟复现异常的访问情况,来确定是否是部分用户自身的问题。

2、模块2 CDN加速异常与模块3源站问题:在收到用户报障后,如果排除第一种情况(问题可以复现,且非单用户问题),我们可以通过对比测试来定位问题是在CDN侧还是源站侧——通过对比访问源站及CDN域名,来定位问题模块。

对比访问方式

假设访问出现异常的URL为:http://www.domain.com/1.jpg,源站服务器IP为:111.111.111.111

1)、访问CDN URL:http://www.domain.com/1.jpg

2)、访问源站 URL:http://111.111.111.111/1.jpg

我们可以通过上面两条访问URL的结果来进行对比:如果源站访问是正常的,但CDN访问是异常的,则定位模块2(CDN加速)出现问题;否则,则是模块3(源站)出现异常(因为源站出现异常,必然也导致CDN加速也出现异常)

注:如果是非单页面出现异常,可以在host文件中,配置指定域名直接指向源站,来进行源站访问对比测试。在HOST文件(HOST文件地址:C:\Windows\System32\drivers\etc\hosts)最后空白处新增一行内容如下,:

源站IP   访问域名

来配置访问域名时,绕过CDN,直接访问源站,如在本例中,增加:

111.111.111.111 www.domain.com

并保存文件,之后我们通过浏览器访问:http://www.domain.com/1.jpg,就会绕过CDN,直接访问源站了(可以用于对比测试是否源站出现问题),记得测试完,需要回到HOST文件,把这行再删除哦~

二、解决问题:优先恢复业务

在定位完问题后,我们就需要考虑如何快速恢复业务了:

1、针对模块1(用户侧)出现的问题,需要根据用户环境进行分析,这类情况影响面一般比较小,而且各情况不尽相同,这里就不展开了(其实是无法展开-_-!!)

2、针对模块2(CDN侧)出现的问题:需要动动手,收集一些信息。这里,我以访问http://www.sina.com.cn/favicon.ico为例,给大家截图展示下对应的信息收集过程,

    1)、准备好信息收集的环境:先打开浏览器,在浏览器界面中按下 F12 ,打开【开发者人员工具】,然后选择network(网络);

     2)、模拟访问,收集信息:再进行异常页面访问,并找到或过滤到异常的URL,点击后,可以找到对应的【标头】信息,将访问的【标头】信息收集起来(可以简单粗暴的将所有信息都截图起来),并反馈给CDN厂商,让CDN厂商及时进行解决;

3、针对模块3(源站)出现的问题:如果明确是源站出现的问题,则需要及时对源站发布的内容进行调整,调整完成后,再进行对外发布。另外,很重要的一点!!!如果原来CDN中针对异常访问的URL有缓存了,那么在源站发布新文件后,一定要到CDN控制台上,针对异常URL进行【内容刷新】,以天翼云CDN控制台为例(入口:https://cdn.ctyun.cn/),刷新操作界面,如下图:

        目的就是将原来缓存在CDN上的异常内容删除掉(目前各厂商CDN控制台上都有这一功能),不然,虽然源站发布了新内容,但是实际用户还是可能访问到CDN缓存的异常内容的哦~

三、反思:业务高可用规划

        另外,针对CDN模块的问题,在条件允许的情况下,建议在平日运营中,将业务分量跑在不同的CDN厂商,这样,在任意一个CDN厂商出现问题情况下,可以通过切换域名DNS解析的方式,快速将业务调整至稳定运行的CDN厂家,待CDN问题解决后,再恢复分量调度模式,从业务架构上达到高可用的方案

        做为业务运营方,我们即使不知道CDN具体的运作情况,但是也可以通过以上简单问题定位原则及对应的问题恢复手段,达到保障业务稳定的目的。另外,有条件的话,平日运营工作中,一定要把业务高可用规划给安排起来哦~~

 

文章来自专栏

运营相关

2 篇文章 1 订阅
0 评论
0/1000
评论(0) 发表评论
  • 2
    点赞
  • 0
    收藏
  • 0
    评论