时间:2021-07-01 10:21:17 帮助过:2人阅读
【产生原因】
定时任务在执行flush slow logs前未加set sql_log_bin=0;导致在slave上执行时,slave上的GTID增长,当binlog日志被purge后,发生MHA切换后就会报出上面的错误。
【修复步骤】
下面描述正确的处理步骤:
1、切换后如果出现replication报错,第一时间先关闭master的binlog备份
2、修复导致slave事务增长的job脚本set sql_log_bin=0; flush slow logs
3、slave上stop slave;
4、master上show global variables like ‘%gtid%‘;记录gtid_purged,gtid_executed值
5、slave上reset master;
6、slave上set global gtid_purged=‘3d9ade83-7cea-11e5-bc12-d89d6725f98c:1-863017556,
8fad86b1-8980-11e8-873d-40a8f024a124:1-24531;
这里需要注意,设置的值应该是上面截图红色框两段组合的值,这样才能保证再次切换后复制正常
7、slave上start slave;
对于这次的场景,按上次步骤恢复后会丢失8fad86b1-8980-11e8-873d-40a8f024a124:1-24531这段事务,但这段事务实际上是flush slow logs事务,并不影响业务数据,因此理论上数据会一致
上述方法修复后,建议用pt-table-checksum工具,检验主从数据的一致性。
复制相关的文章
MySQL 5.7基于GTID复制的常见问题和修复步骤(一)
MySQL 5.7基于GTID复制的常见问题和修复步骤(二)
标签:nlog 工具 top sum span 问题 lob art tps