第一次接觸R,看到一條代碼便能畫出各式各樣的統計圖,超級興奮。拿課后題的college數據集畫了畫圖標,得到一些有趣的小結果。 首先,可以先看看數據集的基本信息
summary(college) pairs(college[, 1:10])

習題里提示可以用 Elite = college$Top10perc >50來代表那些精英大學
whether or not the PRoportion of students coming from the top 10% of their high school classes exceeds 50%.
于是我便畫了許多以Elite為橫坐標, 其他各式各樣的指標為縱坐標的箱線圖

上面的這四張圖表容易理解,讓我好奇的是下面這一張 
按(來自top10%高中的)同學超過入學人數的50%為依據,判斷為精英大學,個人消費水平明顯低一些,尤其是最高的幾個消費數據點。難道是大家都在認真學習,不愛出去或者沒有時間出去消費?
接著,我把Elite的指標改成了80%來top10,
Elite[college$Top10perc > 80] = “Yes”
改成80%后,平均水平反而超過了普通學習,而最高的那一簇不變。
這樣子圖表看一看數據集的數據還挺有意思的,等下次我用不一樣的圖表來看哈。
http://www-bcf.usc.edu/~gareth/ISL/
新聞熱點
疑難解答