国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

pandas去重復行并分類匯總的實現方法

2020-02-16 00:58:27
字體:
來源:轉載
供稿:網友

今天主要記錄一下pandas去重復行以及如何分類匯總。以下面的數據幀作為一個例子: 

import pandas as pddata=pd.DataFrame({'產品':['A','A','A','A'],'數量':[50,50,30,30]})

pandas判斷dataframe是否含有重復行數據用:df.duplicated()

 第一次出現的數據為False.重復的數據行就被記錄為True。

去掉重復行數據使用data.drop_duplicates().

 可以看到索引亂了,我們使用data.reset_index(),里面的參數drop=True,表明要舍掉原來的索引,不然的話原來的索引會保留下來。

 分類匯總主要使用groupby(表明匯總的條件列)以及agg(要匯總的字段/列以及匯總的方式:求和還是最大最小值或者計數)。完整代碼如下圖

# -*- coding: utf-8 -*-"""Created on Fri Jul 20 09:08:10 2018@author: FanXiaoLei"""import pandas as pddata=pd.DataFrame({'產品':['A','A','A','A'],'數量':[50,50,30,30]})if data.duplicated:  dataA=data.drop_duplicates().reset_index(drop=True)print(dataA)dataB=dataA.groupby(by='產品').agg({'數量':sum})print('數據匯總結果:')print(dataB)

結果展示如下圖:

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 陈巴尔虎旗| 永靖县| 大余县| 宁河县| 海宁市| 佛教| 广州市| 吴桥县| 临泽县| 观塘区| 防城港市| 蒲城县| 沁水县| 临夏市| 双江| 乐陵市| 平乡县| 额济纳旗| 称多县| 屏东市| 佳木斯市| 龙口市| 河南省| 广州市| 湟源县| 五峰| 双辽市| 达拉特旗| 崇阳县| 肥乡县| 新野县| 色达县| 太和县| 万宁市| 依兰县| 崇信县| 福清市| 华安县| 莎车县| 蒙自县| 松阳县|