国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python分析學校四六級過關情況

2020-02-16 10:48:42
字體:
來源:轉載
供稿:網友

這段時間看了數據分析方面的內容,對Python中的numpy和pandas有了最基礎的了解。我知道如果我不用這些技能做些什么的話,很快我就會忘記。想起之前群里發過一個學校的四六級成績表,正好可以用來熟悉一下pandas中的一些用法。

1.數據介紹。

成績表中包含的字段十分詳細,里面有年級、性別、姓名、分數等等的一系列內容,我只想簡單的分析一下我們學校的四六級過關率而已,所以去除了一些不必要的字段。留下的有如下幾個字段:

第一列是自增的序號,沒有什么實際意義。

第二列就是代表著該學生參加的是四級還是六級。

第三列是我們學校的院系名稱。

第四列是學校院系的各個專業。

第五列是年級,13代表著2013年入學。

第六列是性別。

后面的三列分別是總分、聽力、閱讀、寫作等。

其中總分為0的都是缺考的。一共有接近9000條數據(沒有報名的不在其中)。

2.預期結果。

我想利用這些數據最終通過圖標的形式展示出以下幾點:

1.各個學院的四六級平均分。

2.各個學院的四六級過關人數。

3.各個學院的各個年級過關人數。

4.各個年級的過關人數。

5.男生女生分別過關人數。

最終結果:

各個學院的四六級過關人數:

3.實現過程。

(1)導入依賴包。

程序分別使用了pandas進行分組轉換,和matplotlib提供的繪圖功能。

import pandas as pdimport matplotlib.pylab as plt

(2)加載數據。

想要分析數據自然要得到數據了,我將整理的數據存放在sj.xls中,是一個Excel類型的數據。
這一步使用pandas的read_excel即可,生成一個DataFrame對象。

#加載全部數據sj = pd.read_excel(r'F:/DataAnalysis/sj.xls')

加載完之后輸出一下看看內容:

除了排版沒有對齊之外其他都一樣。

(3)統計各個學院平均分。

在這里就可以完成我們預期的第一個結果:

各個學院的四六級平均分:

想要各個學院的情況當然是要根據學院來進行分組了,同時也需要分出“CET4”和“CET6”兩組。使用groupby即可,這樣會生成一個SeriesGroupBy對象,然后再調用mean函數(默認是軸0計算,也就是我們想要的結果)即可統計出平均分情況。

#按照各個學院進行分組xymean = sj['總分'].groupby([sj['院系名稱'],sj['語言級別']])#計算各個學院的平均分數xymean = xymean.mean()            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 芜湖市| 桃园市| 仁布县| 永仁县| 翁源县| 竹山县| 湄潭县| 麻城市| 南宫市| 寿宁县| 奉新县| 阳春市| 武川县| 前郭尔| 观塘区| 全南县| 上饶县| 昔阳县| 清苑县| 东光县| 乌拉特中旗| 济阳县| 克什克腾旗| 两当县| 雅江县| 博兴县| 平山县| 蓝山县| 朝阳区| 龙海市| 封丘县| 镇安县| 栾川县| 兴和县| 平阴县| 太谷县| 巩义市| 东安县| 乐山市| 岢岚县| 双峰县|