国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

pandas DataFrame 刪除重復(fù)的行的實(shí)現(xiàn)方法

2020-02-16 00:57:41
字體:
供稿:網(wǎng)友

1. 建立一個(gè)DataFrame

 C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

2. 判斷是否有重復(fù)項(xiàng)

用duplicated( )函數(shù)判斷  

C.duplicated()

3.  有重復(fù)項(xiàng),則可以用drop_duplicates()移除重復(fù)項(xiàng)

C.drop_duplicates()

4. Duplicated( )和drop_duplicates( )方法是以默認(rèn)的方式判斷全部的列(上面的例子中是看兩個(gè)變量a和b是否都是重復(fù)出現(xiàn))。

我們也可以對特定的列進(jìn)行重復(fù)項(xiàng)判斷。

 C.duplicated(['a'])   C.drop_duplicates(['a']) C.duplicated(['b'])   C.drop_duplicates(['b'])

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重復(fù)的行,并保留重復(fù)出現(xiàn)的行中第一次出現(xiàn)的行

補(bǔ)充: 

當(dāng)keep=False時(shí),就是去掉所有的重復(fù)行  當(dāng)keep=‘first'時(shí),就是保留第一次出現(xiàn)的重復(fù)行  當(dāng)keep='last'時(shí)就是保留最后一次出現(xiàn)的重復(fù)行。 

(注意,這里的參數(shù)是字符串,要加引號(hào)!!!)

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持武林站長站。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 德惠市| 韩城市| 同江市| 太湖县| 扶余县| 大竹县| 贵港市| 沽源县| 洪洞县| 沐川县| 沿河| 双桥区| 巴塘县| 金堂县| 虎林市| 静海县| 方城县| 沙洋县| 获嘉县| 洛阳市| 博白县| 苗栗县| 建始县| 沅陵县| 大英县| 丹凤县| 民和| 鹤峰县| 秀山| 桂平市| 波密县| 饶河县| 永兴县| 芮城县| 凌海市| 定结县| 黑河市| 仙居县| 扶绥县| 鹤壁市| 新沂市|