国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

瑣碎-關于hadoop2.2.0

2019-11-14 21:36:05
字體:
來源:轉載
供稿:網友
瑣碎-關于hadoop2.2.0

HDFS模塊功能

  • namenode:主節點,存儲文件的元數據如文件名、文件目錄結構、文件屬性(生成時間、副本數、文件權限)、以及每個文件的塊列表和塊所在的datanode等;
  • datanode:在本地文件系統存儲文件塊數據,以及塊的校驗和;
  • secondary namenode:用來監控HDFS狀態的輔助后臺程序,每隔一段時間獲取HDFS元數據的快照;

YARN模塊功能

ResourceManager:

  1. 處理客戶端請求;
  2. 啟動/監控applicationMaster;
  3. 監控NodeManager;
  4. 資源分配和調度;

NodeManager:

  1. 單個節點的資源管理;
  2. 處理來自ResourceManager的命令;
  3. 處理來自ApplicationManager的命令;

ApplicationMaster:

  1. 數據切分;
  2. 為應用程序申請資源,并分配給內部任務;
  3. 任務監控和容錯;

Container:

  • 對任務運行環境的抽象,封裝了CPU、內存等多維資源以及環境變量、啟動命令等任務運行相關信息;


MR模塊功能

... ...


日志

  • 啟動日志文件目錄 $HADOOP_HOME/logs;
  • 日志格式 .out和.log

    .log:通過log4j記錄的,大部分的應用日志信息;

    .out:記錄標準輸出和標準錯誤日志,少。

  •  日志命名規則

    框架名稱-用戶名-進程名-主機名-日志格式后綴


目錄sbin里面的啟動腳本中有hadoop-daemon.sh、yarn-daemon.sh和hadoop-daemons.sh、yarn-daemon.sh

它們有什么區別呢?

hadoop-daemon.sh分別啟動每個進程,在slave上也要手動去敲命令

而hadoop-daemon.sh只需要在namenode中就可以,它從配置文件中獲取所有的slave,然后遠程上去調用hadoop-daemon.sh啟動單個進程。

yarn-daemon.sh也一樣。


歷史服務器

1.x中有jobtracker,2.x中沒有,那怎么從web ui中查看歷史作業運行情況呢?

那就是historyserver。

默認情況下歷史服務器不啟動

啟動命令和關閉命令

  • sbin/mr-jobhistory-daemon.sh start historyserver
  • sbin/mr-jobhistory-daemon.sh stop historyserver

web UI地址: http://master:19888/


在2.X中多了一種針對MR小作業的優化機制:Uber模式

在運行一個作業的時候會有一條輸出語句為Job job_xxxxxx_xxxx running in uber mode:false/true

如果作業足夠小,則所有的task在一個JVM(mr app master)中完成作業,比每個task啟動一個container更劃算

手動設置參數:maPReduce.job.ubertask.enable 默認為 false


notepad+FZ+SecureCRT這個組合還不錯



發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 阳泉市| 隆德县| 沈丘县| 西平县| 越西县| 乐陵市| 山西省| 开封市| 县级市| 神池县| 濉溪县| 临沭县| 阿拉善盟| 高密市| 沭阳县| 锡林浩特市| 兴宁市| 常宁市| 巴彦县| 东丰县| 台中市| 鲁山县| 洮南市| 黄山市| 安徽省| 澄迈县| 麻栗坡县| 巴塘县| 灵台县| 同仁县| 榕江县| 武定县| 苍溪县| 金堂县| 霞浦县| 海晏县| 辉南县| 抚州市| 鄄城县| 肇州县| 麻阳|