mysql 數據同步 出現Slave_IO_Running:No問題的解決方法小結
2024-07-24 12:44:29
供稿:網友
下面寫一下,這兩個要是有no了,怎么恢復。。
如果是slave_io_running no了,那么就我個人看有三種情況,一個是網絡有問題,連接不上,像有一次我用虛擬機搭建replication,使用了nat的網絡結構,就是死都連不上,第二個是有可能my.cnf有問題,配置文件怎么寫就不說了,網上太多了,最后一個是授權的問題,replication slave和file權限是必須的。如果不怕死就all咯。。
一旦io為no了先看err日志,看看爆什么錯,很可能是網絡,也有可能是包太大收不了,這個時候主備上改max_allowed_packet這個參數。
如果是slave_sql_running no了,那么也有兩種可能,一種是slave機器上這個表中出現了其他的寫操作,就是程序寫了,這個是會有問題的,今天我想重現,但是有時候會有問題,有時候就沒有問題,現在還不是太明了,后面再更新,還有一種占絕大多數可能的是slave進程重啟,事務回滾造成的,這也是mysql的一種自我保護的措施,像關鍵時候只讀一樣。
這個時候想恢復的話,只要停掉slave,set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;再開一下slave就可以了,這個全局變量賦值為N的意思是:
This statement skips the next N events from the master. This is useful for recovering from replication stops caused by a statement.
This statement is valid only when the slave thread is not running. Otherwise, it produces an error.
呵呵,講的比我清楚。
MYSQL鏡像服務器因錯誤停止的恢復
下午主服務器,由于一些原因,導致死機,重啟后,發現從服務器的數據沒有跟上。
配好MYSQL主從也才前幾天的事,沒多少經驗,第一次碰上這問題,有點焦急。不過,自己試了下,還算解決了:)
從服務器上
Master_Log_File: mysqlhxmaster.000007
Read_Master_Log_Pos: 84285377
看一下主服務器:mysqlhxmaster.000007 | 84450528 |
已經過后很多了,確實沒跟上。
show slave status/G
Slave_IO_Running: Yes
Slave_SQL_Running: No
有問題了,Slave_SQL_Running應該是Yes才對。
再往下看,有錯誤的提示:
Last_Errno: 1053
Last_Error: Query partially completed on the master (error on master: 1053) and was aborted. There is a chance that your master is inconsistent at this point. If you are sure that your master is ok, run this query manually on the slave and then restart the slave with SET GLOBAL SQL_SLAVE_SKIP_COUNTER=1; START SLAVE; . Query: 'INSERT INTO hx_stat_record ......(一句SQL語句)'
這里有說明要怎么操作了:)
先stop slave,然后執行了一下提示的語句,再SET GLOBAL SQL_SLAVE_SKIP_COUNTER=1; START SLAVE;
show slave status/G
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
OK了,從服務器也在幾分鐘內把堆積的log處理完了,兩邊又同步了:)