国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

跟天齊老師學Spark(1)--Spark簡介

2019-11-11 03:19:49
字體:
來源:轉載
供稿:網友
spark官網:http://spark.apache.orgSpark其實是一個大數據計算引擎,只能解決計算的問題,它需要依賴數據的存儲系統;Spark不會取代Hadoop,因為Hadoop不僅是解決了計算的問題,它還解決了存儲的問題;spark是apache旗下的一個開源框架。它的logo:快如閃電的一個集群。用來做大規模的數據計算處理。在2016年7月出來spark-2.0版本,我們現在使用的是1.6.2版本;Spark比hadoop的MaPReduce在內存中快100倍,即使在磁盤上也比Hadoop快10倍。在Spark的計算引擎之上有很多強大的工具:spark sql,spark streaming,mllib,graphx。提供一站式計算服務(離線計算、實時計算、機器學習、圖計算等)。這些都是它的子項目,但是他們都是運行在spark的計算引擎之上。有了spark的話,我們只要一個spark集群即可。如果用hadoop的話,要維護hadoop集群,可能還要維護storm集群。但是如果你的公司搞了2年hadoop相關的技術了,現在突然轉向spark的話,可能轉化的成本比較高。如果你的公司剛開始起步,可以優先選擇spark技術。它的特點:快,易用(java,scala,python,R),通用,運行在多平臺(可以運行在yarn這個資源調度平臺上,可以從hdfs中讀數據,再寫入hdfs,還可以運行在mesos資源調度平臺上,spark還可以運行在自己獨立的集群模式上,這就是standalone集群模式,spark還可以運行在云上,可以從hdfs中讀數據,從hbase中讀數據,從cassandra中讀數據,還可以跑在S3上)對spark貢獻排名第一的是一個華人(美國伯克利大學)。還有很多的國人面孔。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 清水县| 合山市| 绥芬河市| 乐清市| 荆门市| 常州市| 博客| 武功县| 阿克| 区。| 双鸭山市| 吉隆县| 鹤峰县| 柳河县| 敦煌市| 新龙县| 班戈县| 辽阳市| 舟曲县| 萍乡市| 吉木乃县| 武夷山市| 岳池县| 呼玛县| 富锦市| 子洲县| 湘潭县| 綦江县| 林西县| 正蓝旗| 电白县| 沙雅县| 田东县| 始兴县| 泰安市| 泰州市| 杭锦后旗| 富民县| 桦川县| 定远县| 江门市|