alwayson故障模拟及处理方案
source link: https://blog.51cto.com/waringid/5868824
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
数据库高可用环境的搭建可以参考以下文章
2.测试环境与总结
3.检查环境与配置情况
3.1.群集正常
群集IP地址在alwayson2上
3.2.alwayson正常
alwayson IP地址在alwayson1上
3.3.群集故障转移配置
3.4.alwayson故障转移配置
4.模拟故障
4.1.断开alwayson ip所在的服务器网络
a1、alwayson IP中断2到3秒,alwayson IP自动飘移到成员服务器
a2、网络中断的时候循环脚本作业已经停止,如图可以看到网络中断这台服务器的alwayson数据库都是未同步,无法执行任何操作的。需要在飘移后的alwayson IP重新执行作业。
a3、前面几次断开网络恢复接入后自动恢复正常的,由于短时间内出现3次故障现在已隔离状态,两小时后自动尝试重新加入群集。
a3处理方案:
a3.1、等两小时后自动清除隔离状态并加入群集恢复正常
a3.2、在powershell输入命令手动清除隔离状态加入群集恢复正常
start-clusternode -name alwayson1 -cluster wsfc -clearquarantine |
4.2.执行循环脚本并重启master服务器
b1、master已经飘移到alwayson2上。
b2、重启好后自动加入群集。
群集已经恢复正常
数据库也已经同步好,过程全自动
4.3.循环脚本执行同时重启slave服务器
循环脚本执行(5分56秒)同时并重启两台slave服务器,111.23重启5分钟完成,111.21重启8分钟左右
c1、重启好后自动加入群集,数据自动同步。
4.4.主从同时重启
d1、服务器重启好后全自动加入群集和数据同步
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK