前言:人工智能機器學(xué)習(xí)有關(guān)算法內(nèi)容,請參見公眾號之前相關(guān)文章。人工智能之機器學(xué)習(xí)主要有三大類:1)分類;2)回歸;3)聚類。今天我們重點探討一下回歸模型(RM)。
回歸不是單一的有監(jiān)督學(xué)習(xí)技術(shù),而是許多技術(shù)所屬的整個類別。回歸的目的是預(yù)測數(shù)值型的目標(biāo)值,如預(yù)測商品價格、未來幾天的PM2.5等。最直接的辦法是依據(jù)輸入寫出一個目標(biāo)值的計算公式,該公式就是所謂的回歸方程(regressionequation)。求回歸方程中的回歸系數(shù)的過程就是回歸?;貧w是對真實值的一種逼近預(yù)測?;貧w是統(tǒng)計學(xué)中最有力的算法之一。
回歸概念:
回歸是一個數(shù)學(xué)術(shù)語,指研究一組隨機變量(Y1,Y2 ,…,Yi)和另一組(X1,X2,…,Xk)變量之間關(guān)系的統(tǒng)計分析方法,又稱多重回歸分析。其中, X1、X2,…,Xk是自變量,Y1,Y2,…,Yi是因變量。
回歸模型:
回歸模型(Regression Model)對統(tǒng)計關(guān)系進(jìn)行定量描述的一種數(shù)學(xué)模型。它是一種預(yù)測性的建模技術(shù),研究的是因變量(目標(biāo))和自變量(預(yù)測器)之間的關(guān)系。這種技術(shù)通常用于預(yù)測分析,時間序列模型以及發(fā)現(xiàn)變量之間的因果關(guān)系。
回歸分析:
回歸模型重要的基礎(chǔ)或者方法就是回歸分析。回歸分析是研究一個變量(被解釋變量)關(guān)于另一個(些)變量(解釋變量)的具體依賴關(guān)系的計算方法和理論,是建模和分析數(shù)據(jù)的重要工具?;貧w分析是用已知樣本對未知公式參數(shù)的估計,給出一個點集D,用一個函數(shù)去擬合這個點集,并且使得點集與擬合函數(shù)間的誤差最小。
回歸分類:
在統(tǒng)計學(xué)中,回歸分析(regression analysis)指的是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法?;貧w分析按照涉及的變量多少,分為一元回歸和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。
常見的回歸種類有:線性回歸、曲線回歸、邏輯回歸等。
線性回歸:
如果擬合函數(shù)為參數(shù)未知的線性函數(shù),即因變量和自變量為線性關(guān)系時,則稱為線性回歸。
通過大量訓(xùn)練,得到一個與數(shù)據(jù)擬合效果最好的模型,可利用一些算法(比如最小二乘法、梯度下降法等)和工具(SPSS)來更快更好的訓(xùn)練出適用的線性回歸模型。實質(zhì)是求解出每個特征自變量的權(quán)值θ。
在訓(xùn)練過程中,特征選擇,擬合優(yōu)化等都需要考慮。
最終目標(biāo)是確定每個權(quán)值(參數(shù))θ或者通過算法逼近真實的權(quán)值(參數(shù))θ。
需要注意的是,線性回歸不是指樣本的線性,樣本可以是非線性的,而是指對參數(shù)θ的線性。
線性回歸問題:可能會出現(xiàn)欠擬合、非滿秩矩陣問題等。
解決方法:解決欠擬合問題,可采用局部加權(quán)線性回歸LWLR(Locally Weighted Linear Regression)。解決非滿秩矩陣問題,可使用嶺回歸RR(ridge regression)、Lasso法、前向逐步回歸等。
算法優(yōu)點:
1)最可解釋的機器學(xué)習(xí)算法之一,理解與解釋都十分直觀;
2)易于使用,因為需要最小的調(diào)諧;
3)運行快,效率高;
4)最廣泛使用的機器學(xué)習(xí)技術(shù)。
非線性回歸:
如果擬合函數(shù)為參數(shù)未知的非線性函數(shù),則稱為非線性或曲線回歸。非線性函數(shù)的求解一般可分為將非線性變換成線性和不能變換成線性兩大類。
1) 變換成線性:處理非線性回歸的基本方法。通過變量變換,將非線性回歸化為線性回歸,然后用線性回歸方法處理。一般采用線性迭代法、分段回歸法、迭代最小二乘法等。
2)不能變換成線性:基于回歸問題的最小二乘法,在求誤差平方和最小的極值問題上,應(yīng)用了最優(yōu)化方法中對無約束極值問題的一種數(shù)學(xué)解法——單純形法。該算法比較簡單,收斂效果和收斂速度都比較理想。
常見的非線性回歸模型:1)雙曲線模型;2)冪函數(shù)模型;3)指數(shù)函數(shù)模型;4)對數(shù)函數(shù)模型;5)多項式模型。
12下一頁>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )