Python多項式回歸的實現方法

2020-01-04 13:36:13

字體：大中小

來源：轉載

供稿：網友

多項式回歸是一種線性回歸形式，其中自變量x和因變量y之間的關系被建模為n次多項式。多項式回歸擬合x的值與y的相應條件均值之間的非線性關系，表示為E（y | x）

為什么多項式回歸：

研究人員假設的某些關系是曲線的。顯然，這種類型的案例將包括多項式項。
檢查殘差。如果我們嘗試將線性模型擬合到曲線數據，則預測變量（X軸）上的殘差（Y軸）的散點圖將在中間具有許多正殘差的斑塊。因此，在這種情況下，這是不合適的。
通常的多元線性回歸分析的假設是所有自變量都是獨立的。在多項式回歸模型中，不滿足該假設。

多項式回歸的使用：

這些基本上用于定義或描述非線性現象，例如：

組織生長速度。
疾病流行病的進展
湖泊沉積物中碳同位素的分布

回歸分析的基本目標是根據自變量x的值來模擬因變量y的期望值。在簡單回歸中，我們使用以下等式 y = a + bx + e

這里y是因變量，a是y截距，b是斜率，e是誤差率。

在許多情況下，這種線性模型將無法解決。例如，如果我們在這種情況下根據合成溫度分析化學合成的產生，我們使用二次模型y = a + b1x + b2 ^ 2 + e

這里y是x的因變量，a是y截距，e是誤差率。

通常，我們可以將其建模為第n個值。y = a + b1x + b2x ^ 2 + .... + bnx ^ n

由于回歸函數在未知變量方面是線性的，因此這些模型從估計的角度來看是線性的。

因此，通過最小二乘技術，讓我們計算y的響應值。

Python中的多項式回歸:

要獲得用于分析多項式回歸的數據集，請單擊此處。

步驟1：導入庫和數據集

導入重要的庫和我們用于執行多項式回歸的數據集。

# Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset datas = pd.read_csv('data.csv') datas

Python,多項式回歸

第2步：將數據集分為2個組件

將數據集劃分為兩個組件，即X和yX將包含1到2之間的列.y將包含2列。

X = datas.iloc[:, 1:2].values y = datas.iloc[:, 2].values

第3步：將線性回歸擬合到數據集

擬合線性回歸模型在兩個組件上。

# Fitting Linear Regression to the dataset from sklearn.linear_model import LinearRegression lin = LinearRegression() lin.fit(X, y)

第4步：將多項式回歸擬合到數據集

將多項式回歸模型擬合到兩個分量X和y上。

# Fitting Polynomial Regression to the dataset from sklearn.preprocessing import PolynomialFeatures poly = PolynomialFeatures(degree = 4) X_poly = poly.fit_transform(X) poly.fit(X_poly, y) lin2 = LinearRegression() lin2.fit(X_poly, y)

步驟5：在此步驟中，我們使用散點圖可視化線性回歸結果。

# Visualising the Linear Regression results plt.scatter(X, y, color = 'blue') plt.plot(X, lin.predict(X), color = 'red') plt.title('Linear Regression') plt.xlabel('Temperature') plt.ylabel('Pressure') plt.show()

Python,多項式回歸

步驟6：使用散點圖可視化多項式回歸結果。

# Visualising the Polynomial Regression results plt.scatter(X, y, color = 'blue') plt.plot(X, lin2.predict(poly.fit_transform(X)), color = 'red') plt.title('Polynomial Regression') plt.xlabel('Temperature') plt.ylabel('Pressure') plt.show()

Python,多項式回歸

步驟7：使用線性和多項式回歸預測新結果。

# Predicting a new result with Linear Regression lin.predict(110.0)

Python,多項式回歸

# Predicting a new result with Polynomial Regression lin2.predict(poly.fit_transform(110.0))

Python,多項式回歸

使用多項式回歸的優點：

廣泛的功能可以適應它。
多項式基本上適合寬范圍的曲率。
多項式提供了依賴變量和自變量之間關系的最佳近似。

使用多項式回歸的缺點

這些對異常值過于敏感。
數據中存在一個或兩個異常值會嚴重影響非線性分析的結果。
此外，遺憾的是，用于檢測非線性回歸中的異常值的模型驗證工具少于線性回歸。

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持VEVB武林網。

注：相關教程知識閱讀請移步到python教程頻道。

上一篇：Python實現定制自動化業務流量報表周報功能【XlsxWriter模塊】

下一篇：Python3轉換html到pdf的不同解決方案

學習交流

解決內存不足妙方

解決內存不足妙方...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

雷軍2020新年全員信：“5G+AIoT”五年投500億

2020-01-03 21:43:53

春運售票超3億張！售票總量再創歷史新高

2020-01-03 20:41:46

Windows10市場份額全球第一微軟是否再無敵手？

2020-01-03 20:31:47

比爾蓋茨一次錯誤，付出2.8萬億的代價

2020-01-02 08:44:34

長江迎來最長禁漁期：十年禁漁，方才有魚

2020-01-02 08:28:02

快手封殺淘寶？回應：系統升級，淘寶商品暫無法審核

2020-01-01 22:50:39

疑難解答

圖片精選

網友關注

国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

Python多項式回歸的實現方法