數(shù)據(jù)挖掘技術(shù)日趨成熟和復(fù)雜,隨著互聯(lián)網(wǎng)發(fā)展以及大批海量數(shù)據(jù)的到來,之前傳統(tǒng)的依靠spss、SAS等可視化工具實(shí)現(xiàn)數(shù)據(jù)挖掘建模已經(jīng)越來越不能滿足日常需求,依據(jù)美國(guó)對(duì)數(shù)據(jù)科學(xué)家(data scientist)的要求,想成為一名真正的數(shù)據(jù)科學(xué)家,編程實(shí)現(xiàn)算法以及編程實(shí)現(xiàn)建模已經(jīng)是必要條件;目前很多從事數(shù)據(jù)挖掘工作的人,大多都是出身非計(jì)算機(jī)專業(yè),本身對(duì)編程基礎(chǔ)比較低,所以找到一門快速上手而又高效的編程語言是至關(guān)重要的,好的工具和編程語言可以起到事半功倍的效果。
目前在數(shù)據(jù)挖掘算法方面用的最多的編程語言有:Java、C++、C、Python、R等等
R語言作為統(tǒng)計(jì)界第一語言(軟件),很多時(shí)候與我們號(hào)稱分析界第一語言的Python老是被人拿起來對(duì)比,所以今天專門做了一個(gè)表格,簡(jiǎn)介一下R語言與Python語言的對(duì)比情況。
首先還是我Python神圖壓鎮(zhèn):

首先介紹一下R語言吧:
有個(gè)小段子,說為什么要叫R語言呢?就是因?yàn)閮晌粍?chuàng)始人的名字,都是以"R"開頭的,所以,干脆一拍即合,就叫R語言吧……

R語言有很多的特點(diǎn)……當(dāng)然,看這張圖,是不是覺得很眼熟啊,沒錯(cuò),如果看過以前那篇“Python大法好”的文章的同學(xué),發(fā)現(xiàn),R語言怎么和Python的特性這么相似捏?

其實(shí)R也有很多自己特性,下面是它最顯著的幾個(gè)特性:
1、就是命令模式。Python雖然也支持命令模式,但是相對(duì)來說,更偏向于流程控制語句,也就是可以寫一堆語句,然后執(zhí)行。R本身基本上不需要用到流程控制(當(dāng)然,它也支持流程控制)。
2、就是交互性。這樣是命令模式的一個(gè)特點(diǎn),敲回車,出結(jié)果。但是又不像SPSS那種用鼠標(biāo)扎針的交互方式(在鍵盤上運(yùn)指如飛逼格瞬間提升很多……好萊塢大片里面,高手黑客都是不用鼠標(biāo)的,當(dāng)然,這樣很合理,SSH或者Telent到遠(yuǎn)程服務(wù)器上,怎么鼠標(biāo)?)
3、也是R語言最大的特點(diǎn),統(tǒng)計(jì)學(xué)特性……好吧R語言與其他所有計(jì)算機(jī)語言最大的本質(zhì)區(qū)別,就是它是一門統(tǒng)計(jì)學(xué)家發(fā)明的語言(其他語言,基本上都是碼農(nóng)發(fā)明的,當(dāng)然,也有數(shù)學(xué)家發(fā)明的),那么就有很多神奇特點(diǎn)。
比如:賦值的時(shí)候,不用等號(hào)(=),用的是指向(<-),帶來的問題就是要寫a<-5
這種語句,就需要a<(-5)這樣寫。
比如對(duì)象下面的屬性,不用點(diǎn)(.),而是用刀樂($)。當(dāng)然,點(diǎn)也能用,但是又帶來各種問題,比如R語言的變量命名法則不用遵循匈牙利法則……可以用中文啊有木有:
新聞熱點(diǎn)
疑難解答
圖片精選