1

alwayson故障模拟及处理方案

 1 year ago
source link: https://blog.51cto.com/waringid/5868824
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

数据库高可用环境的搭建可以参考以下文章

2.测试环境与总结

alwayson故障模拟及处理方案_alwayson 高可用

3.检查环境与配置情况

3.1.群集正常

alwayson故障模拟及处理方案_故障模拟_02

群集IP地址在alwayson2上

alwayson故障模拟及处理方案_三节点_03

3.2.alwayson正常

alwayson故障模拟及处理方案_三节点_04

alwayson IP地址在alwayson1上

alwayson故障模拟及处理方案_高可用_05

3.3.群集故障转移配置

alwayson故障模拟及处理方案_故障模拟_06

3.4.alwayson故障转移配置

alwayson故障模拟及处理方案_alwayson 高可用_07

4.模拟故障

4.1.断开alwayson ip所在的服务器网络

a1、alwayson IP中断2到3秒,alwayson IP自动飘移到成员服务器

alwayson故障模拟及处理方案_alwayson 高可用_08
alwayson故障模拟及处理方案_故障模拟_09

a2、网络中断的时候循环脚本作业已经停止,如图可以看到网络中断这台服务器的alwayson数据库都是未同步,无法执行任何操作的。需要在飘移后的alwayson IP重新执行作业。

alwayson故障模拟及处理方案_高可用_10

a3、前面几次断开网络恢复接入后自动恢复正常的,由于短时间内出现3次故障现在已隔离状态,两小时后自动尝试重新加入群集。

alwayson故障模拟及处理方案_alwayson 高可用_11
alwayson故障模拟及处理方案_高可用_12

a3处理方案:

a3.1、等两小时后自动清除隔离状态并加入群集恢复正常

a3.2、在powershell输入命令手动清除隔离状态加入群集恢复正常

start-clusternode -name alwayson1 -cluster wsfc -clearquarantine
alwayson故障模拟及处理方案_alwayson 高可用_13

4.2.执行循环脚本并重启master服务器

b1、master已经飘移到alwayson2上。

alwayson故障模拟及处理方案_高可用_14
alwayson故障模拟及处理方案_alwayson 高可用_15

b2、重启好后自动加入群集。

alwayson故障模拟及处理方案_故障模拟_16

群集已经恢复正常

alwayson故障模拟及处理方案_三节点_17
alwayson故障模拟及处理方案_故障模拟_18

数据库也已经同步好,过程全自动

alwayson故障模拟及处理方案_故障模拟_19

4.3.循环脚本执行同时重启slave服务器

循环脚本执行(5分56秒)同时并重启两台slave服务器,111.23重启5分钟完成,111.21重启8分钟左右

alwayson故障模拟及处理方案_高可用_20

c1、重启好后自动加入群集,数据自动同步。

alwayson故障模拟及处理方案_高可用_21
alwayson故障模拟及处理方案_高可用_22
alwayson故障模拟及处理方案_故障模拟_23

4.4.主从同时重启

alwayson故障模拟及处理方案_高可用_24
alwayson故障模拟及处理方案_三节点_25

d1、服务器重启好后全自动加入群集和数据同步

alwayson故障模拟及处理方案_三节点_26
alwayson故障模拟及处理方案_故障模拟_27
alwayson故障模拟及处理方案_故障模拟_28

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK