国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

pandas求兩個表格不相交的集合方法

2020-02-16 00:00:59
字體:
來源:轉載
供稿:網友

Hi,好久不見,我還是那顆翻滾的老鼠屎。處理數據時想求兩個表格求不相交的部分,或許是對知識的匱乏限制了我的想象力,并未找到直接求的方法,在這里介紹老鼠屎技己使用的方法,希望對讀者會有幫助。

pandas求兩個表格不相交的集合

陰影部分為所要求的部分(但是前提是A、B兩個集合都是無重復內容的集合)

首先先造兩個DataFrame來做示例。

import pandas as pd a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} a=pd.DataFrame(a0) b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} b=pd.DataFrame(b0) 

看一下兩個DataFrame的樣子

pandas求兩個表格不相交的集合

關于差集,我們是要去除兩個DataFrame中公共的部分,因此我的想法是:

(1)先將兩個DataFrame融合為一個DataFrame;

(2)去掉當中公共的部分(使用drop_duplicates去重)。

下面來看一下代碼:

c=a.append(b)c.drop_duplicates(keep=False,inplace=True)c.reset_index()

這里想要說明的是,drop_duplicates當中的參數keep=False,意為重復項全部刪除,它還有keep="first"與keep="last",分別對應在有多項重復時,保留第一項(或最后一項)。具體可參考官方文檔。

得到的效果是如下所示。雖然過程很簡單,但是很好用。

pandas求兩個表格不相交的集合

同樣的道理可用來求差集,在此不做贅述。

以上這篇pandas求兩個表格不相交的集合方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 沙坪坝区| 石屏县| 南京市| 太康县| 安顺市| 寻乌县| 黄陵县| 石林| 涪陵区| 子长县| 延长县| 吉木乃县| 略阳县| 敦化市| 武冈市| 专栏| 资源县| 桑日县| 遂平县| 镇安县| 漾濞| 虞城县| 刚察县| 文成县| 东至县| 建昌县| 平昌县| 衡南县| 普洱| 托克逊县| 莎车县| 曲松县| 巨野县| 阿拉善左旗| 贵阳市| 泰宁县| 寻乌县| 阳东县| 孟州市| 平阴县| 咸阳市|