在做機器學習的時候,遇到這樣一個數據集...
一共399行10列,
1-9列是用不定長度的空格分割,
第9-10列之間用'/t'分割,
前九列都是數值類型,其中第三列有若干個'?'填充的缺失值...
第十列是字符串類型,..
部分數據截圖:
之前我是用python強寫的...很麻煩,代碼如下:
至此,可以已平均值,填充缺失值...
今天再回顧此數據庫;決定用pandas庫來試試;
1,導包,用pandas.read_table導入數據集,
2,數據處理
最后輸出如下:
以上這篇python處理兩種分隔符的數據集方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持VEVB武林網。
新聞熱點
疑難解答