国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > MySQL > 正文

每秒570000的寫入,MySQL如何實現?

2024-07-24 12:32:10
字體:
來源:轉載
供稿:網友
        MySQL數據庫如何實現每秒570000的寫入,通過本文了解下。
 
一、需求
 
       一個朋友接到一個需求,從大數據平臺收到一個數據寫入在20億+,需要快速地加載到MySQL中,供第二天業務展示使用。
 
二、實現再分析
 
      對于單表20億, 在MySQL運維,說真的這塊目前涉及得比較少,也基本沒什么經驗,但對于InnoDB單表Insert 如果內存大于數據情況下,可以維持在10萬-15萬行寫入。但很多時間我們接受的項目還是數據超過內存的。這里使用XeLabs TokuDB做一個測試。
 
三、XeLabs TokuDB 介紹
 
      項目地址:
 
相對官方TokuDB的優化:
 
內置了jemalloc 內存分配
 
引入更多的內置的TokuDB性能指標
 
支持Xtrabackup備份
 
引入ZSTD壓縮算法
 
支持TokuDB的binlog_group_commit特性
 
四、測試表
 
TokuDB核心配置:
 
loose_tokudb_cache_size=4G
 
loose_tokudb_directio=ON
 
loose_tokudb_fsync_log_period=1000
 
tokudb_commit_sync=0
 
表結構
 
CREATE TABLE `user_summary` (
 
 `user_id` bigint(20) unsigned NOT NULL COMMENT '用戶id/手機號',
 
 `weight` varchar(5) DEFAULT NULL COMMENT '和碼體重(KG)',
 
 `level` varchar(20) DEFAULT NULL COMMENT '重量級',
 
 `beat_rate` varchar(12) DEFAULT NULL COMMENT '擊敗率',
 
 `level_num` int(10) DEFAULT NULL COMMENT '同噸位人數',
 
 UNIQUE KEY `u_user_id` (`user_id`)
 
) ENGINE=TokuDB DEFAULT CHARSET=utf8
 
利用load data寫入數據
 
root@localhost [zst]>LOAD DATA INFILE '/u01/work/134-136.txt'
 
INTO TABLE user_summary(user_id, weight, level, beat_rate,level_num);
 
Query OK, 200000000 rows affected (5 min 48.30 sec)
 
Records: 200000000 Deleted: 0 Skipped: 0 Warnings: 0
 
計算一下每秒寫入速度:
 
root@localhost [zst]>select 200000000/(5*60+48.30);
 
+------------------------+
 
| 200000000/(5*60+48.30) |
 
+------------------------+
 
| 574217.6285 |
 
+------------------------+
 
1 row in set (0.00 sec)
 
文件大小:
 
-rw-r--r-- 1 root root 8.5G 11月 25 20:05 134-136.txt
 
-rw-r----- 1 mysql mysql 8.6K 11月 25 20:44 user_summary.frm
 
-rw-r----- 1 mysql mysql 3.5G 11月 25 20:51 user_summary_main_229_1_1d_B_0.tokudb
 
實際文件8.5G,寫入TokuDB大小3.5G,只是接近于一半多點的壓縮量。對于20億數據寫入,實際測試在58分鐘多點就可以完成。可以滿足實際需求,另外對于磁盤IO比較好的機器(SSD類盤,云上的云盤),如果內存和數據差不多情況,這量級數據量測試在Innodb里需要添加自增列,可以在3個小多一點完成。從最佳實戰上來看,Innodb和TokuDB都寫入同樣的數據,InnoDB需要花大概是TokuDB3-4倍時間。文件大小區別,同樣20億數據:
 
-rw-r----- 1 mysql mysql 35G 11月 25 23:29 user2_main_26a_1_1d_B_0.tokudb
 
-rw-r----- 1 mysql mysql 176G 11月 26 03:32 user5.ibd
 
文件大小在5倍大小的區別。
 
測試結論:
 
利用TokuDB在某云環境中8核8G內存,500G高速云盤環境,多次測試可以輕松實現57萬每秒的寫入量。
 
另外測試幾種場景也供大家參考:如果在TokuDB中使用帶自增的主鍵,主鍵無值讓MySQL內部產生寫入速度,下降比較明顯,同樣寫入2億數據,帶有自建主鍵:
 
root@localhost [zst]>CREATE TABLE `user3` (
 
 -> `user_id` bigint(20) unsigned NOT NULL COMMENT '用戶id/手機號',
 
 -> `weight` varchar(5) DEFAULT NULL COMMENT '和碼體重(KG)',
 
 -> `level` varchar(20) DEFAULT NULL COMMENT '重量級',
 
 -> `beat_rate` varchar(12) DEFAULT NULL COMMENT '擊敗率',
 
 -> `level_num` int(10) DEFAULT NULL COMMENT '同噸位人數',
 
 -> `id` bigint(20) NOT NULL AUTO_INCREMENT,
 
 -> PRIMARY KEY (`id`),
 
 -> UNIQUE KEY `u_user_id` (`user_id`)
 
 -> ) ENGINE=TokuDB;
 
Query OK, 0 rows affected (0.03 sec)
 
root@localhost [zst]>LOAD DATA INFILE '/u01/work/134-136.txt' INTO TABLE user3(user_id, weight, level, beat_rate,level_num);
 
Query OK, 200000000 rows affected (22 min 43.62 sec)
 
Records: 200000000 Deleted: 0 Skipped: 0 Warnings: 0
 
同樣的數據寫入在主鍵自增無值產生時,不能使用TokuDB的 Bulk loader data特性,相當于轉換為了單條的Insert實現,所以效果上慢太多。
 
關于TokuDB Bulk Loader前提要求,這個表是空表,對于自增列,如自增列有值的情況下,也可以使用。建議實際使用中,如果自增列有值的情況下,可以考慮去除自增屬性,改成唯一索引,這樣減少自增的一些處理邏輯,讓TokuDB能跑地更快一點。另外在Bulk Loader處理中為了追求更快速的寫入,壓縮方面并不是很好。
 
關于TokuDB Bulk Loader :
 
https://github.com/percona/PerconaFT/wiki/TokuFT-Bulk-Loader
 
五、測試環境說明
 
測試使用CentOS7環境,編譯的XeLabs TokuDB版本百度云地址:
 
https://pan.baidu.com/s/1qYRyH3I 。

(編輯:武林網)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 类乌齐县| 东港市| 定襄县| 广东省| 古蔺县| 清徐县| 柘荣县| 安达市| 兰州市| 金塔县| 云南省| 会昌县| 林周县| 济源市| 韩城市| 永宁县| 睢宁县| 始兴县| 毕节市| 宜州市| 灌阳县| 汝州市| 宝丰县| 新龙县| 兴和县| 巴马| 龙岩市| 南和县| 丹棱县| 星座| 卢湾区| 双柏县| 成安县| 镶黄旗| 聂荣县| 浮梁县| 乌兰浩特市| 邹城市| 盐亭县| 杭锦后旗| 蕉岭县|