Prophet:Facebook 簡(jiǎn)單高效的時(shí)間序列模型

導(dǎo)讀:

時(shí)序預(yù)測(cè)是一個(gè)很常見(jiàn)的數(shù)據(jù)科學(xué)任務(wù),可以幫助組織或個(gè)人進(jìn)行目標(biāo)規(guī)劃或者異常檢測(cè)等。

本文介紹的是 Facebook 2017 年的工作——Prophet,這是一個(gè)適用于大規(guī)模的時(shí)序預(yù)測(cè)模型。它不僅解決了時(shí)序預(yù)測(cè)的建模問(wèn)題,還解決了模型的可解釋性問(wèn)題。

此外,F(xiàn)acebook 提供了 Prophet 的開(kāi)源代碼,并且將模型封裝的非常簡(jiǎn)單且友好,極大地降低了分析人員的入門門檻,同時(shí)也提供了各種接口以便分析人員靈活地調(diào)整模型。

1 為什么有 Prophet

構(gòu)建一個(gè)高質(zhì)量的預(yù)測(cè)不是一件容易事,而在商業(yè)預(yù)測(cè)的實(shí)踐過(guò)程中通常會(huì)出現(xiàn)兩個(gè)問(wèn)題:

完全自動(dòng)的預(yù)測(cè)技術(shù)不夠靈活,過(guò)于死板;分析師通常有較高的專業(yè)知識(shí),但是在時(shí)序模型預(yù)測(cè)方面一無(wú)所知;

預(yù)測(cè)是一個(gè)需要大量專業(yè)經(jīng)驗(yàn)的任務(wù),因此,如何能夠提供一個(gè)高質(zhì)量且簡(jiǎn)單易用的預(yù)測(cè)模型成了一個(gè)亟需解決的問(wèn)題。

為此,F(xiàn)acebook 的研究員進(jìn)行了大量的研究,并提出了 Prophet 模型,該模型非常簡(jiǎn)單靈活,適用于沒(méi)有進(jìn)行過(guò)時(shí)序預(yù)測(cè)的人員,同時(shí)也提供了非常人性化的配置。

下圖展示了大規(guī)模商業(yè)分析中的循環(huán)方法,其由自動(dòng)化建模和人工干預(yù)兩部分組成:

Modeling:首先分析師會(huì)使用制定的參數(shù)對(duì)時(shí)間序列進(jìn)行建模;Foreca and Evaluation:然后由模型產(chǎn)生預(yù)測(cè)并對(duì)其進(jìn)行評(píng)估;Surface Problems:當(dāng)性能不佳時(shí)可以進(jìn)行人工干預(yù),并將問(wèn)題標(biāo)記給分析師;Visually Inspect Forecasts:分析師進(jìn)行檢查并根據(jù)反饋調(diào)整模型。

2 Prophet 預(yù)測(cè)模型

在介紹模型之前,我們先看一張圖:

這是 Facebook 的真實(shí)數(shù)據(jù)集,每一天都有一個(gè)點(diǎn),點(diǎn)的顏色按照星期進(jìn)行編碼,以展示一個(gè)星期的周期性。

從這張圖中我們可以看到:這個(gè)時(shí)間序列具有周期性 (weekly、yearly)、趨勢(shì)變化性 (Trend)、異常點(diǎn) (outliers) 和節(jié)假日效應(yīng) (holiday)。

我們可以使用時(shí)間序列分解將其分解為趨勢(shì)、季節(jié)性、節(jié)假日:

其中,g(t)建模時(shí)間序列值非周期變化的趨勢(shì)函數(shù);s(t)建模周期性變換,包括 weekly、yearly;h(t)建模不規(guī)律的假期影響;誤差項(xiàng) 表示模型不適應(yīng)的任何特殊變化;后面我們會(huì)假設(shè)這個(gè)參數(shù)服從正態(tài)分布。

這類規(guī)范類似于廣義可加模型 (Generalized additive model,GAM),這是一種非線性的回歸模型。這里 Prophet 只使用時(shí)間作為回歸因子,并用幾個(gè)線性和非線性的時(shí)間函數(shù)作為分量。

GAM 不具備 ARIMA 重要的推論優(yōu)勢(shì),但其也具備其他方面的優(yōu)勢(shì):

靈活性強(qiáng),易于分解,且在必要時(shí)也可以容納新的成分;擬合速度快,允許用戶進(jìn)行交互式探索;測(cè)量值不需要有規(guī)則的間隔,也不需要對(duì)缺失值進(jìn)行處理;參數(shù)的可解釋性強(qiáng),方便用戶更改。

接下來(lái)我們關(guān)注模型分解后的不同模塊。

1234下一頁(yè)>

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2020-08-03
Prophet:Facebook 簡(jiǎn)單高效的時(shí)間序列模型
導(dǎo)讀:時(shí)序預(yù)測(cè)是一個(gè)很常見(jiàn)的數(shù)據(jù)科學(xué)任務(wù),可以幫助組織或個(gè)人進(jìn)行目標(biāo)規(guī)劃或者異常檢測(cè)等。本文介紹的是 Facebook 2017 年的工作——Prophet,這是一個(gè)適用于大規(guī)模的時(shí)序預(yù)測(cè)模型。

長(zhǎng)按掃碼 閱讀全文