概述
主机高可用提供应用级的高可用保护软件。数据层基于磁盘镜像方式实时捕获生产数据并复制到灾备服务器;应用层实时监控运行状态,若出现异常(如服务异常停止、网络异常、硬件故障、系统宕机)导致业务不可达时,将应用切换到灾备服务器上,通过应用接管实现业务的连续性。
前提条件
按照网络配置与drnode安装部署流程完成网络环境配置、模块化安装部署、许可授权管理及同步节点创建等四项标准化前置流程。
环境要求
高可用规则需要一些环境要求,分别如下:
装有drnode节点的工作机,并以节点(容灾主机角色)的形式添加进控制台,工作机节点需要有主机高可用许可。
装有drnode节点的灾备机,并以节点(容灾主机角色)的形式添加进控制台,灾备机节点需要有主机高可用许可。
灾备机需要部署工作机被保护的相同应用。
(可选)用户若配置共享IP,需要准备一个可使用的IP地址,作为应用服务端对外提供业务访问的IP地址。
(可选)用户若配置基于共享存储的集群,需要准备具有iSCSI功能的存储,参与集群的节点需要配置iSCSI发起者程序连接iSCSI目标并挂载共享磁盘。
新建规则
登录天翼云,进入控制中心。
单击管理控制台左上角的
,选择区域。
在服务列表选择“计算”-“多活容灾服务”,进入多活容灾服务控制台。
点击左侧菜单栏-“资源同步”-“资源同步管理”,进入资源同步管理页面。
点击左侧菜单栏-“主机高可用”,点击“高可用”,进入高可用页面。
点击“新建”按钮,进入新建高可用规则页面。
基本设置页面的配置项如下:
参数 | 配置说明 |
---|---|
规则名称 | 用户自定义的高可用规则名称,便于管理,支持中文和英文字符,区分和识别当前任务的名称。 |
自动切换 | 若勾选自动切换时;当高可用规则满足切换条件时,原从节点会变为主节点,原主节点变为从节点; 若不勾选自动切换时,当高可用规则满足切换条件时,规则状态会提示警告,用户需要手动执行切换。 |
重启接管 | 此配置仅在高可用规则的主、从节点中仅有单节点存活并发生重启时生效;不开启重启接管(也不开启自动切换)时,单节点重启后,角色为游离,不加载相关资源,需要人工手动“强制切换”后变为主节点,并加载相关资源;开启重启接管时,单节点重启后,如果是原主节点重启,则重启后继续成为主节点;如果是原从节点重启,则重启后可能是主节点或者游离(不勾选“进入复制状态才允许切换”时,角色变为主节点;勾选“进入复制状态才允许切换”时,角色变为游离状态)。 注意:此配置与“自动切换”互斥。 |
节点设置 | 两个节点之间不允许是同一个主机,可添加两个节点加入主机高可用规则,当定义优先级相同的时候,在规则启动后设置为初始主节点的主机将扮演主节点提供应用服务;否则优先级赋值更高的主机会成为初始主节点。 |
仲裁设置 | 不设置:用户可以根据自己的环境选择使用仲裁设置,默认为不使用; |
心跳线 | 主机高可用节点间的通讯模块,负责主机高可用节点间的信息通讯,心跳的检测,出现故障时备端将自动切换。主机高可用节点非网卡IP地址可手动输入(现版本使用的通讯类型都为TCP,选择其他类型暂不可用)。 |
配置完“基本设置”后,单击“下一步”,进行“数据同步”的配置。
数据同步页面的配置项如下:
参数 | 配置说明 |
---|---|
路径映射 | 用户选择主节点的文件系统目录和从节点的文件系统目录实现数据同步,后续可以在复制规则列表页面查询。 |
创建时启动复制规则 | 若启用,提交规则后自动启动主节点到从节点的复制规则。 若不启用,提交规则后用户需手动启动主节点到从节点的复制规则。默认不启用。 |
进入复制状态才允许切换 | 默认为启用。应用切换的前提是两端数据的同步,如果当前状态下的主节点数据文件尚未完全同步到从节点,那么在这个时间点如果进行应用切换让从节点接管服务,会导致两端的数据不一致。不论是前一页配置“自动切换”是否勾选,仅当所配置的数据复制规则处于复制状态,主机高可用切换才会运行执行。但极端情况下,比如生产中心遭受自然灾害整体被摧毁,而且同时假设刚好有生产数据因为网络因素尚未完成到异地的同步,那么这种小概率事件发生的情况下,生产数据无法从生产中心恢复,用户就需要在页面上单击“强制切换”操作,触发异地的应用服务执行接管。页面会弹出警告信息要求用户再次确认后才会执行切换。 |
反向规则 | 若勾选,提交规则后会自动创建由从节点到主节点的复制规则,若不勾选,则不会创建。默认不勾选。 |
自动启动复制规则 | 若勾选时,规则发生切换后,会自动启动相应的复制规则; 若不勾选,规则发生切换后,用户需手动启动相应的复制规则。 |
单击“确定”完成数据同步的配置,单击“下一步”,进行监控对象的配置。
监控对象页面的配置项如下:
参数 | 配置说明 |
---|---|
类型 | 服务监控:指定Windows系统的服务名称作为监控对象。服务运行时监控正常,服务停止时监控失败。 |
检测间隔(秒) | 选择任何一种监控类型,用户都需要配置检测间隔,默认为2秒;用户根据业务系统RPO要求和环境因素进行调整。 |
最大失败次数 | 默认为5次,监控请求但未成功获取对象的运行状态的次数,累积达到5次,drnode程序判定被监控节点对象(服务、进程、内存、CPU、自定义脚本、磁盘)失败。 |
失败后仅记日志 | 勾选时,如果监控的对象出现异常,drnode程序只会在日志中产生警告信息,但不进行切换;默认不勾选。 |
监控角色 | 用户可以选择监控的角色,分为:主节点、从节点、主从节点,共三个选项:当监控的角色满足监控条件后,高可用规则默认会变为告警状态,如果规则开启了自动切换,则会执行角色切换动作。 |
服务名称 | 用户自行填写需要保护的应用对应的服务名。 |
配置完“监控对象”后,单击“下一步”,进行“资源切换”的配置。
资源切换页面的配置项如下:
参数 | 配置说明 |
---|---|
类型 | 脚本切换资源:高可用规则发生切换的过程中执行,从节点变为主节点时执行获取资源执行脚本,主节点变为从节点时执行释放资源执行脚本。 |
完成上述配置后,点击“确定”按钮,完成高可用规则创建。
上述内容详情可参见多活容灾服务用户帮助手册-主机高可用。
最佳实践
灾备机:1台灾备机可接管1台生产机;灾备机建议配置:与生产机对等。
灾备机与生产机1:1对应。
灾备机CPU、内存硬盘等与生产机相同。
网络要求:与增量数据相关。