国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發(fā)設計 > 正文

hadoop筆記之切片大小控制

2019-11-06 06:35:15
字體:
來源:轉載
供稿:網友

轉自  http://blog.csdn.net/xiaoshunzi111/article/details/48367683

HDFS的block是邏輯上的數據塊.Hadoop2.0中每一塊默認大小128MB,實際存儲過程中block大小小于等128MB,它是以文件為存儲對象.如一200MB大小文件,分兩個數據塊128MB+72MB 這里的兩個塊大實際小分別是128MB和72MB

算法分析:

max(minSize, min(maxSize,blockSize))

min(maxSize,blockSize)取maxSize,blockSize之間的最小值

max(minSize, min())取minSize, min()之間的最大值

blockSize=128MB

所以增加切片大小有要調整 min(maxSize,blockSize)中maxSize值

減小切片大小調整minSize值.

具體兩個方法如下:

FileInputFormat.setMaxInputSplitSize(job, size);

FileInputFormat.setMinInputSplitSize(job, size);


發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 霍城县| 盈江县| 西青区| 南京市| 商水县| 鄂托克前旗| 奉新县| 万载县| 永登县| 裕民县| 姚安县| 呼图壁县| 普格县| 青海省| 兰考县| 东平县| 崇明县| 霍州市| 精河县| 江孜县| 贵溪市| 巨野县| 江源县| 从江县| 逊克县| 武威市| 日喀则市| 东乡县| 都昌县| 章丘市| 苏州市| 宝清县| 恩施市| 磐安县| 达拉特旗| 太白县| 金沙县| 静乐县| 临澧县| 信宜市| 柳州市|