HDFS模塊功能
YARN模塊功能
ResourceManager:
NodeManager:
ApplicationMaster:
Container:

MR模塊功能
... ...
日志
.log:通過log4j記錄的,大部分的應用日志信息;
.out:記錄標準輸出和標準錯誤日志,少。
框架名稱-用戶名-進程名-主機名-日志格式后綴
目錄sbin里面的啟動腳本中有hadoop-daemon.sh、yarn-daemon.sh和hadoop-daemons.sh、yarn-daemon.sh
它們有什么區別呢?
hadoop-daemon.sh分別啟動每個進程,在slave上也要手動去敲命令
而hadoop-daemon.sh只需要在namenode中就可以,它從配置文件中獲取所有的slave,然后遠程上去調用hadoop-daemon.sh啟動單個進程。
yarn-daemon.sh也一樣。
歷史服務器
1.x中有jobtracker,2.x中沒有,那怎么從web ui中查看歷史作業運行情況呢?
那就是historyserver。
默認情況下歷史服務器不啟動
啟動命令和關閉命令
web UI地址: http://master:19888/
在2.X中多了一種針對MR小作業的優化機制:Uber模式
在運行一個作業的時候會有一條輸出語句為Job job_xxxxxx_xxxx running in uber mode:false/true
如果作業足夠小,則所有的task在一個JVM(mr app master)中完成作業,比每個task啟動一個container更劃算
手動設置參數:maPReduce.job.ubertask.enable 默認為 false
notepad+FZ+SecureCRT這個組合還不錯



新聞熱點
疑難解答