有時對于MaPReduce等框架來說,需要有一套更底層的API來獲取某個指定文件中的一部分數據,而不是一整個文件。一方面來說,獲取整個文件是對網絡的很大壓力;另一方面,可能整個文件非常大,客戶端也存不下。因此這篇博客再體驗一下HDFS的流式API。
如圖所示:


輸出結果為:
block-length:134217728--block-offset:0anode1.mrbcy.techanode2.mrbcy.techblock-length:79874467--block-offset:134217728anode2.mrbcy.techanode1.mrbcy.tech新聞熱點
疑難解答