在前一篇文章中解釋了線性回歸以及如何梯度下降的方法優(yōu)化參數(shù),內(nèi)容參考了吳恩達(dá)老師的《機器學(xué)習(xí)》和書籍《機器學(xué)習(xí)實戰(zhàn)》
這一篇再次回顧線性回歸的概念已經(jīng)它的應(yīng)用場景,重點展示一個應(yīng)用的例子。 目錄如下:
線性回歸的概念線性回歸的優(yōu)缺點線性回歸的應(yīng)用及例子
回歸可以用來做預(yù)測和分類,當(dāng)目標(biāo)值是連續(xù)的時,我們稱為回歸;當(dāng)目標(biāo)值是離散的時,我們稱為分類。線性回歸其實就是函數(shù)擬合。假設(shè)我們有了訓(xùn)練集包含
上一篇文章講了梯度下降的方法來找到最優(yōu)的參數(shù),還有另一種通過矩陣的方式來優(yōu)化參數(shù)(具體推導(dǎo)過程可參考斯坦福 《machine learning》課程,之后會寫文章專門推導(dǎo)),參數(shù)優(yōu)化的公式為:

線性回歸可以處理數(shù)值型的數(shù)據(jù),并且預(yù)測目標(biāo)數(shù)據(jù)為連續(xù)型數(shù)據(jù)
應(yīng)用例子:根據(jù)天氣中的 CO 和 NOX量 推測 O3量(使用了UCI Air quality 數(shù)據(jù)集)
收集數(shù)據(jù) UCI提供了大量的不同行業(yè)的數(shù)據(jù)集,鏈接如下: https://archive.ics.uci.edu/ml/datasets.html 其中我選擇的是Air quality的數(shù)據(jù): 
準(zhǔn)備數(shù)值
Air quality的數(shù)據(jù)格式如下: 
由于線性回歸要求連續(xù)型數(shù)值,我選擇了 3,10作為自變量,11作為被預(yù)測的因變量。 先從網(wǎng)站上把數(shù)據(jù)下載下來,然后做處理提取出對應(yīng)的數(shù)據(jù)。

尋找回歸系數(shù)

然后可視化結(jié)果 我首先是想畫出兩個自變量和目標(biāo)值的3D圖,但是不知道原因結(jié)果并不顯示,所以我畫出來了預(yù)測值和目標(biāo)值的二維圖,它們應(yīng)該會盡量靠近一條

總結(jié): 這個例子很多地方不完善,作為一個學(xué)習(xí)的例子理解線性回歸的應(yīng)用場景。
Reference:
S. De Vito, E. Massera, M. Piga, L. Martinotto, G. Di Francia, On field calibration of an electronic nose for benzene estimation in an urban pollution monitoring scenario, Sensors and Actuators B: Chemical, Volume 129, Issue 2, 22 February 2008, Pages 750-757, ISSN 0925-4005,].
哈林頓李銳. 機器學(xué)習(xí)實戰(zhàn) : Machine learning in action[M]. 人民郵電出版社, 2013.
新聞熱點
疑難解答