mysql partition 分區功能使用詳解

2024-07-24 12:37:27

字體：大中小

來源：轉載

供稿：網友

mysql partition自mysql 5.1.3起開始支持分區功能。mysql表中存儲的記錄和表對應的索引信息，最后都是以文件的方式存儲在計算機的硬盤上的，有了分區功能我們就可以做比以前更多優化了。

目前分區規則有四種，分別是RANGE、LIST、HASH和KEY，另外通過DATA DIRECTORY和INDEX DIRECTORY選項可以把不同的分區數據文件分散到不同的磁盤上，從而進步一提高系統的IO吞吐量。因此按照業務邏輯設計好了分區，可以大大提高查詢效率，而且刪除數據可能也會很容易。但是分區也有一些限制：1、主鍵或者唯一索引必須包含分區字段；2、只能通過int類型的字段或者返回int類型的表達式來分區；3、單表最多只能有1024個分區。

默認mysql是開啟了分區功能的,可以通過下述查詢查看結果:

show variables like '%partition%';

+-------------------+-------+

| Variable_name | Value |

+-------------------+-------+

| have_partitioning | YES |

+-------------------+-------+

YES 表示開啟下面也range規則為例介紹一下分區常用的命令。

1、創建分區,可以在創建表的同時創建,也可以在表創建后追加分區,代碼如下:

drop table if exists `netingcn_com`;

create table `netingcn_com` (

  `id` int(11) unsigned not null auto_increment,

  `day` int(11) not null default 0,

  primary key (`id`, `day`)

) engine=innodb default charset=utf8 auto_increment=1;

alter table `netingcn_com` partition by range(`day`) (

  partition p_2012 values less than (20130000),

  partition p_2013 values less than (20140000)

);

--或

drop table if exists `netingcn_com`;

create table `netingcn_com` (

  `id` int(11) unsigned not null auto_increment,

  `day` int(11) not null default 0,

  primary key (`id`, `day`)

) engine=innodb default charset=utf8 auto_increment=1

partition by range(`day`) (

  partition p_2012 values less than (20130000),

  partition p_2013 values less than (20140000)

);

可以explain命令查看分區是否創建成功,代碼如下:

explain partitions select * from netingcn_com where day = 20130412;

+----+-------------+--------------+------------+-------+

| id | select_type | table | partitions | type |

+----+-------------+--------------+------------+-------+

| 1 | SIMPLE | netingcn_com | p_2013 | index |

+----+-------------+--------------+------------+-------+

2、增加或刪除分區,注意,刪除分區的同時,該分區的所有數據也會別刪除,增加分區,代碼如下:

alter table netingcn_com add partition (

partition p_2014 values less than (20150000)

);

--刪除分區

alter table netingcn_com drop partition p_2012;

--3、重新分區。注意：hash和key分區規則不能用REORGANIZE.來重新分區

alter table netingcn_com reorganize partition p_2013,p_2014 into (partition p_2014 values less than (20150000));

[分區表和未分區表試驗過程],*創建分區表,按日期的年份拆分,代碼如下:

mysql> CREATE TABLE part_tab ( c1 int default NULL, c2 varchar(30) default NULL, c3 date default NULL) engine=myisam

PARTITION BY RANGE (year(c3)) (PARTITION p0 VALUES LESS THAN (1995),

PARTITION p1 VALUES LESS THAN (1996) , PARTITION p2 VALUES LESS THAN (1997) ,

PARTITION p3 VALUES LESS THAN (1998) , PARTITION p4 VALUES LESS THAN (1999) ,

PARTITION p5 VALUES LESS THAN (2000) , PARTITION p6 VALUES LESS THAN (2001) ,

PARTITION p7 VALUES LESS THAN (2002) , PARTITION p8 VALUES LESS THAN (2003) ,

PARTITION p9 VALUES LESS THAN (2004) , PARTITION p10 VALUES LESS THAN (2010),

PARTITION p11 VALUES LESS THAN MAXVALUE );

注意最后一行,考慮到可能的最大值,創建未分區表,代碼如下:

mysql> create table no_part_tab (c1 int(11) default NULL,c2 varchar(30) default NULL,c3 date default NULL) engine=myisam;

通過存儲過程灌入800萬條測試數據,代碼如下:

mysql> set sql_mode=''; /* 如果創建存儲過程失敗，則先需設置此變量, bug? */

mysql> delimiter //   /* 設定語句終結符為 //，因存儲過程語句用;結束 */

mysql> CREATE PROCEDURE load_part_tab()

       begin

    declare v int default 0;

    while v < 8000000

    do

        insert into part_tab

        values (v,'testing partitions',adddate('1995-01-01',(rand(v)*36520) mod 3652));

         set v = v + 1;

    end while;

    end

    //

mysql> delimiter ;

mysql> call load_part_tab();

Query OK, 1 row affected (8 min 17.75 sec)

mysql> insert into no_part_tab select * from part_tab;

Query OK, 8000000 rows affected (51.59 sec)

Records: 8000000 Duplicates: 0 Warnings: 0

測試SQL性能,代碼如下:

mysql> select count(*) from part_tab where c3 > date '1995-01-01' and c3 < date '1995-12-31';

+----------+

| count(*) |

+----------+

|   795181 |

+----------+

1 row in set (0.55 sec)

mysql> select count(*) from no_part_tab where c3 > date '1995-01-01' and c3 < date '1995-12-31';

+----------+

| count(*) |

+----------+

|   795181 |

+----------+

1 row in set (4.69 sec)

結果表明分區表比未分區表的執行時間少90%.

通過explain語句來分析執行情況:

mysql > explain select count(*) from no_part_tab where c3 > date '1995-01-01' and c3 < date '1995-12-31'G

/* 結尾的G使得mysql的輸出改為列模式 */

*************************** 1. row ***************************

           id: 1

select_type: SIMPLE

        table: no_part_tab

         type: ALL

possible_keys: NULL

          key: NULL

      key_len: NULL

          ref: NULL

         rows: 8000000

        Extra: Using where

1 row in set (0.00 sec)

mysql> explain select count(*) from part_tab where c3 > date '1995-01-01' and c3 < date '1995-12-31'G

*************************** 1. row ***************************

           id: 1 --Vevb.com

select_type: SIMPLE

        table: part_tab

         type: ALL

possible_keys: NULL

          key: NULL

      key_len: NULL

          ref: NULL

         rows: 798458

        Extra: Using where

1 row in set (0.00 sec)

explain語句顯示了SQL查詢要處理的記錄數目,代碼如下:

* 試驗創建索引后情況

mysql> create index idx_of_c3 on no_part_tab (c3);

Query OK, 8000000 rows affected (1 min 18.08 sec)

Records: 8000000 Duplicates: 0 Warnings: 0

mysql> create index idx_of_c3 on part_tab (c3);

Query OK, 8000000 rows affected (1 min 19.19 sec)

Records: 8000000 Duplicates: 0 Warnings: 0

創建索引后的數據庫文件大小列表：

2008-05-24 09:23             8,608 no_part_tab.frm

2008-05-24 09:24       255,999,996 no_part_tab.MYD

2008-05-24 09:24        81,611,776 no_part_tab.MYI

2008-05-24 09:25                 0 part_tab#P#p0.MYD

2008-05-24 09:26             1,024 part_tab#P#p0.MYI

2008-05-24 09:26        25,550,656 part_tab#P#p1.MYD

2008-05-24 09:26         8,148,992 part_tab#P#p1.MYI

2008-05-24 09:26        25,620,192 part_tab#P#p10.MYD

2008-05-24 09:26         8,170,496 part_tab#P#p10.MYI

2008-05-24 09:25                 0 part_tab#P#p11.MYD

2008-05-24 09:26             1,024 part_tab#P#p11.MYI

2008-05-24 09:26        25,656,512 part_tab#P#p2.MYD

2008-05-24 09:26         8,181,760 part_tab#P#p2.MYI

2008-05-24 09:26        25,586,880 part_tab#P#p3.MYD

2008-05-24 09:26         8,160,256 part_tab#P#p3.MYI

2008-05-24 09:26        25,585,696 part_tab#P#p4.MYD

2008-05-24 09:26         8,159,232 part_tab#P#p4.MYI

2008-05-24 09:26        25,585,216 part_tab#P#p5.MYD

2008-05-24 09:26         8,159,232 part_tab#P#p5.MYI

2008-05-24 09:26        25,655,740 part_tab#P#p6.MYD

2008-05-24 09:26         8,181,760 part_tab#P#p6.MYI

2008-05-24 09:26        25,586,528 part_tab#P#p7.MYD

2008-05-24 09:26         8,160,256 part_tab#P#p7.MYI

2008-05-24 09:26        25,586,752 part_tab#P#p8.MYD

2008-05-24 09:26         8,160,256 part_tab#P#p8.MYI

2008-05-24 09:26        25,585,824 part_tab#P#p9.MYD

2008-05-24 09:26         8,159,232 part_tab#P#p9.MYI

2008-05-24 09:25             8,608 part_tab.frm

2008-05-24 09:25                68 part_tab.par

* 再次測試SQL性能

mysql> select count(*) from no_part_tab where c3 > date '1995-01-01' and c3 < date '1995-12-31';    +----------+

| count(*) |

+----------+

|   795181 |

+----------+

1 row in set (2.42 sec)   /* 為原來4.69 sec 的51%*/

重啟mysql(net stop mysql, net start mysql)后,查詢時間降為0.89 sec,幾乎與分區表相同,代碼如下:

mysql> select count(*) from part_tab where c3 > date '1995-01-01' and c3 < date '1995-12-31';

+----------+

| count(*) |

+----------+

|   795181 |

+----------+

1 row in set (0.86 sec)

* 更進一步的試驗

** 增加日期范圍

mysql> select count(*) from no_part_tab where c3 > date '1995-01-01' and c3 < date '1997-12-31';

+----------+

| count(*) |

+----------+

| 2396524 |

+----------+

1 row in set (5.42 sec)

mysql> select count(*) from part_tab where c3 > date '1995-01-01' and c3 < date '1997-12-31';

+----------+

| count(*) |

+----------+

| 2396524 |

+----------+

1 row in set (2.63 sec)

** 增加未索引字段查詢

mysql> select count(*) from part_tab where c3 > date '1995-01-01' and c3 < date

'1996-12-31' and c2='hello';

+----------+

| count(*) |

+----------+

|        0 |

+----------+

1 row in set (0.75 sec)

mysql> select count(*) from no_part_tab where c3 > date '1995-01-01' and c3 < da

te '1996-12-31' and c2='hello';

+----------+

| count(*) |

+----------+

|        0 |

+----------+

1 row in set (11.52 sec)