国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 系統 > Linux > 正文

Hadoop更換du命令降低datanode磁盤IO

2024-08-27 23:59:00
字體:
來源:轉載
供稿:網友

Hadoop是一個比較好用的分布式系統基礎架構了,下面我們來到各位介紹Hadoop更換du命令降低datanode磁盤IO例子,希望對各位帶來幫助.

背景介紹:近期,不少datanode節點的磁盤IO比較高,主要原因還是由于job數量的增多,以及規模的增大.

但任何可以降低磁盤IO消耗的手段,我們都可以嘗試一下,比如,我們經常可以看到hdfs用戶在執行"du -sk"命令:

  1. [root@idc1-server2 ~]# ps -ef| grep "du -sk" 
  2. hdfs     17119 10336  1 00:57 ?        00:00:04 du -sk /data1/dfs/dn/current/BP-1281416642-10.100.1.2-1407274717062 
  3. hdfs     17142 10336  1 00:57 ?        00:00:03 du -sk /data5/dfs/dn/current/BP-1281416642-10.100.1.2-1407274717062 
  4. hdfs     17151 10336  1 00:57 ?        00:00:05 du -sk /data6/dfs/dn/current/BP-1281416642-10.100.1.2-1407274717062 
  5. ...  //Vevb.com 

隨著datanode上的數據不斷增加,這樣頻繁的du操作,會耗時比較長,在CPU和磁盤IO很閑的時候,每次也都會耗時5秒左右,而在服務器負載比較高的時候,這樣的操作就會耗時很長時間.

于是,我們便考慮通過將原有的du命令替換,并基于df命令來編寫一個新的du命令來取而代之,代碼如下:

  1. [root@idc1-server2 ~]# mv /usr/bin/du /usr/bin/du.orig 
  2. [root@idc1-server2 ~]# vim /usr/bin/du 
  3. #!/bin/sh 
  4. mydf=$(df -Pk $2 | grep -vE '^Filesystem|tmpfs|cdrom' | awk '{ print $3 }') 
  5. echo -e "$mydft$2" 
  6. [root@idc1-server2 ~]# chmod +x /usr/bin/du 

不過這樣的話,統計出來的結果不就不準確了嗎?

但具體情況具體應對,一般來說,Hadoop的datanode都會采用不同的磁盤并劃分分區來存儲數據,那么使用df統計出來的結果,誤差應該是很小的.

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 临高县| 清新县| 阿合奇县| 宜良县| 阿图什市| 长葛市| 重庆市| 兰西县| 玉山县| 西宁市| 敦化市| 崇文区| 罗源县| 井研县| 四平市| 丹阳市| 都昌县| 台安县| 江城| 西贡区| 五家渠市| 淮南市| 左权县| 呼伦贝尔市| 自治县| 沙雅县| 邵武市| 封开县| 昭通市| 喀喇沁旗| 章丘市| 舟山市| 商河县| 温州市| 栖霞市| 西乌珠穆沁旗| 信宜市| 教育| 固镇县| 安远县| 通州市|