Python數據預處理之數據規范化（歸一化）示例

2020-02-16 00:31:58

字體：大中小

來源：轉載

供稿：網友

本文實例講述了Python數據預處理之數據規范化。分享給大家供大家參考，具體如下：

數據規范化

為了消除指標之間的量綱和取值范圍差異的影響，需要進行標準化（歸一化）處理，將數據按照比例進行縮放，使之落入一個特定的區域，便于進行綜合分析。

數據規范化方法主要有：

- 最小-最大規范化
- 零-均值規范化

數據示例

代碼實現

#-*- coding: utf-8 -*-#數據規范化import pandas as pdimport numpy as npdatafile = 'normalization_data.xls' #參數初始化data = pd.read_excel(datafile, header = None) #讀取數據(data - data.min())/(data.max() - data.min()) #最小-最大規范化(data - data.mean())/data.std() #零-均值規范化

從命令行可以看到下面的輸出：

>>> (data-data.min())/(data.max()-data.min(
0 1 2 3
0 0.074380 0.937291 0.923520 1.000000
1 0.619835 0.000000 0.000000 0.850941
2 0.214876 0.119565 0.813322 0.000000
3 0.000000 1.000000 1.000000 0.563676
4 1.000000 0.942308 0.996711 0.804149
5 0.264463 0.838629 0.814967 0.909310
6 0.636364 0.846990 0.786184 0.929571
>>> (data-data.mean())/data.std()
0 1 2 3
0 -0.905383 0.635863 0.464531 0.798149
1 0.604678 -1.587675 -2.193167 0.369390
2 -0.516428 -1.304030 0.147406 -2.078279
3 -1.111301 0.784628 0.684625 -0.456906
4 1.657146 0.647765 0.675159 0.234796
5 -0.379150 0.401807 0.152139 0.537286
6 0.650438 0.421642 0.069308 0.595564

上述代碼改為使用print語句打印，如下：

#-*- coding: utf-8 -*-#數據規范化import pandas as pdimport numpy as npdatafile = 'normalization_data.xls' #參數初始化data = pd.read_excel(datafile, header = None) #讀取數據print((data - data.min())/(data.max() - data.min())) #最小-最大規范化print((data - data.mean())/data.std()) #零-均值規范化

可輸出如下打印結果：