国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python pandas消除空值和空格以及 Nan數據替換方法

2020-02-15 23:27:23
字體:
來源:轉載
供稿:網友

在人工采集數據時,經常有可能把空值和空格混在一起,一般也注意不到在本來為空的單元格里加入了空格。這就給做數據處理的人帶來了麻煩,因為空值和空格都是代表的無數據,而pandas中Series的方法notnull()會把有空格的數據也納入進來,這樣就不能完整地得到我們想要的數據了,這里給出一個簡單的方法處理該問題。

方法1:

既然我們認為空值和空格都代表無數據,那么可以先得到這兩種情況下的布爾數組。

這里,我們的DataFrame類型的數據集為df,其中有一個變量VIN,那么取得空值和空格的布爾數組為NONE_VIN。然后通過該布爾數組,就能得到我們要的數據了

NONE_VIN = (df["VIN"].isnull()) | (df["VIN"].apply(lambda x: str(x).isspace()))df_null = df[NONE_VIN]df_not_null = df[~NONE_VIN]

方法2:

直接使用Series的.apply方法來修改變量VIN中的每個值。如果發現是空格,就返回Nan,否則就返回原值。

df["VIN"]=df["VIN"].apply(lambda x: np.NaN if str(x).isspace() else x)df_null = df[df["VIN"].isnull()]df_not_null = df[df["VIN"].notnull()]

將dataframe中的NaN替換成希望的值

import pandas as pddf1 = pd.DataFrame([{'col1':'a', 'col2':1}, {'col1':'b', 'col2':2}])df2 = pd.DataFrame([{'col1':'a', 'col3':11}, {'col1':'c', 'col3':33}])data = pd.merge(left=df1, right=df2, how='left', left_on='col1', right_on='col1')print data# 將NaN替換為Noneprint data.where(data.notnull(), None)

輸出結果:

 col1 col2 col30 a  1 111 b  2 NaN col1 col2 col30 a  1 111 b  2 None

總結:

方法1的思路就是直接判定是否為空格,把空格納入到選擇中來。方法2的思路是先把空格轉換為NaN,然后正常使用.isnull()或.notnull()來得到我們想要的數據。

以上這篇python pandas消除空值和空格以及 Nan數據替換方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 康马县| 东平县| 海盐县| 常熟市| 肃宁县| 岑巩县| 襄樊市| 广东省| 额济纳旗| 磐安县| 靖安县| 布拖县| 南开区| 马公市| 扶风县| 嘉义县| 赤壁市| 通山县| 繁峙县| 梅州市| 大悟县| 九寨沟县| 田林县| 合阳县| 滦南县| 寿光市| 贡嘎县| 崇文区| 巢湖市| 密山市| 庐江县| 盐池县| 本溪| 英山县| 深泽县| 平凉市| 灵石县| 古田县| 武威市| 永德县| 苍山县|