mysql的3種分表方案

2024-07-24 12:47:22

字體：大中小

來源：轉載

供稿：網友

一、先說一下為什么要分表：
當一張的數據達到幾百萬時，你查詢一次所花的時間會變多，如果有聯合查詢的話，有可能會死在那兒了。分表的目的就在于此，減小數據庫的負擔，縮短查詢時間。

根據個人經驗，mysql執行一個sql的過程如下：
1、接收到sql;
2、把sql放到排隊隊列中;
3、執行sql;
4、返回執行結果。
在這個執行過程中最花時間在什么地方呢？第一，是排隊等待的時間，第二，sql的執行時間。其實這二個是一回事，等待的同時，肯定有sql在執行。所以我們要縮短sql的執行時間。

mysql中有一種機制是表鎖定和行鎖定，為什么要出現這種機制，是為了保證數據的完整性，我舉個例子來說吧，如果有二個sql都要修改同一張表的同一條數據，這個時候怎么辦呢，是不是二個sql都可以同時修改這條數據呢？很顯然mysql對這種情況的處理是，一種是表鎖定（myisam存儲引擎），一個是行鎖定（innodb存儲引擎）。表鎖定表示你們都不能對這張表進行操作，必須等我對表操作完才行。行鎖定也一樣，別的sql必須等我對這條數據操作完了，才能對這條數據進行操作。如果數據太多，一次執行的時間太長，等待的時間就越長，這也是我們為什么要分表的原因。

二、分表

1，做mysql集群，例如：利用mysql cluster ，mysql proxy，mysql replication，drdb等等

有人會問mysql集群，根分表有什么關系嗎？雖然它不是實際意義上的分表，但是它啟到了分表的作用，做集群的意義是什么呢？為一個數據庫減輕負擔，說白了就是減少sql排隊隊列中的sql的數量，舉個例子：有10個sql請求，如果放在一個數據庫服務器的排隊隊列中，他要等很長時間，如果把這10個sql請求，分配到5個數據庫服務器的排隊隊列中，一個數據庫服務器的隊列中只有2個，這樣等待時間是不是大大的縮短了呢？這已經很明顯了。所以我把它列到了分表的范圍以內，我做過一些mysql的集群：

linux mysql proxy 的安裝，配置，以及讀寫分離
mysql replication 互為主從的安裝及配置，以及數據同步
優點：擴展性好，沒有多個分表后的復雜操作（php代碼）
缺點：單個表的數據量還是沒有變，一次操作所花的時間還是那么多，硬件開銷大。

2，預先估計會出現大數據量并且訪問頻繁的表，將其分為若干個表

這種預估大差不差的，論壇里面發表帖子的表，時間長了這張表肯定很大，幾十萬，幾百萬都有可能。聊天室里面信息表，幾十個人在一起一聊一個晚上，時間長了，這張表的數據肯定很大。像這樣的情況很多。所以這種能預估出來的大數據量表，我們就事先分出個N個表，這個N是多少，根據實際情況而定。以聊天信息表為例：

上一篇：mysql自動化安裝腳本(ubuntu and centos64)

下一篇：Mysql中Table ‘XXX’ is marked as crashed and last (automatic?)