火山引擎是如何用A/B測(cè)試承載其數(shù)據(jù)驅(qū)動(dòng)理念的?

導(dǎo)語(yǔ):

字節(jié)跳動(dòng)在to B領(lǐng)域又有了新動(dòng)作。

今天上午,字節(jié)跳動(dòng)的to B品牌火山引擎召開(kāi)發(fā)布會(huì),首次對(duì)外亮相。算上巨量引擎和飛書(shū),字節(jié)跳動(dòng)集齊了to B的三駕馬車。

火山引擎的誕生源于客戶需求的驅(qū)動(dòng)。2017年,某手機(jī)廠商找到字節(jié)跳動(dòng),希望對(duì)瀏覽器和應(yīng)用商店的算法做一些優(yōu)化,字節(jié)跳動(dòng)略為遲疑地接下了這一“分外之事”,卻意外獲得了良好效果。

這次合作啟發(fā)了字節(jié)跳動(dòng):9年來(lái),字節(jié)跳動(dòng)憑借著直面用戶的理念、數(shù)據(jù)驅(qū)動(dòng)的工作模式獲得了健康持續(xù)的增長(zhǎng),如果把這背后沉淀出的技術(shù)能力對(duì)外輸出,能夠?qū)π袠I(yè)產(chǎn)生巨大的價(jià)值。

2019年底,火山引擎業(yè)務(wù)團(tuán)隊(duì)正式組建。但數(shù)據(jù)驅(qū)動(dòng)也講了數(shù)年,如何把理念更具體、務(wù)實(shí)地傳遞出去?火山引擎落實(shí)到了一款產(chǎn)品上——A/B測(cè)試。

“很多企業(yè)講數(shù)據(jù)驅(qū)動(dòng),但真正能把理念實(shí)踐起來(lái)的企業(yè)卻很少,而A/B測(cè)試就是踐行數(shù)據(jù)驅(qū)動(dòng)理念最有代表性的產(chǎn)品。”火山引擎總經(jīng)理譚待告訴「甲子光年」。

A/B測(cè)試是什么?它是如何承載火山引擎的數(shù)據(jù)驅(qū)動(dòng)理念的?

科學(xué)決策,復(fù)利增長(zhǎng)

2007年,谷歌產(chǎn)品經(jīng)理丹·西羅克向公司請(qǐng)假,去為當(dāng)時(shí)身為參議員的奧巴馬在芝加哥舉行的總統(tǒng)競(jìng)選活動(dòng)助力。

為了提升捐助額,西羅克在競(jìng)選網(wǎng)頁(yè)做了一個(gè)A/B測(cè)試:

1、針對(duì)競(jìng)選頁(yè)面,團(tuán)隊(duì)選擇了4種按鈕(下圖左)和6種media(下圖右),其中前3種media是圖片,后3種media是視頻;

火山引擎是如何用A/B測(cè)試承載其數(shù)據(jù)驅(qū)動(dòng)理念的?

奧巴馬團(tuán)隊(duì)競(jìng)選頁(yè)面的4*6排列組合方式

2、把登錄網(wǎng)站的用戶隨機(jī)分配到這些排列不同的頁(yè)面上,通常各頁(yè)面的訪問(wèn)人數(shù)相等;

3、對(duì)相關(guān)數(shù)據(jù)進(jìn)行監(jiān)視,一段時(shí)間后,挑選效果好的組合保留和進(jìn)一步優(yōu)化。

最終的測(cè)試結(jié)果是:LEARN MORE和那張黑白色的家庭照片的組合是最受歡迎的。這一組合為奧巴馬隊(duì)額外獲得了三百萬(wàn)的支持者,增加了5700萬(wàn)美元的捐款額。

火山引擎是如何用A/B測(cè)試承載其數(shù)據(jù)驅(qū)動(dòng)理念的?

4種按鈕和6種media的A/B測(cè)試結(jié)果

這就是A/B測(cè)試,又被稱為小流量實(shí)驗(yàn)。針對(duì)想改進(jìn)的某個(gè)功能/UI/邏輯策略等,提供兩種或多種不同的備選方案,從總體用戶中抽取一小部分,隨機(jī)地將抽取出的流量分配給不同方案,最終結(jié)合一定的統(tǒng)計(jì)方法,通過(guò)實(shí)驗(yàn)數(shù)據(jù)對(duì)比來(lái)確定最優(yōu)方案。

A/B測(cè)試最早起源于科研領(lǐng)域,后來(lái),硅谷的互聯(lián)網(wǎng)公司引入了A/B實(shí)驗(yàn)的思想,廣泛應(yīng)用于“業(yè)務(wù)增長(zhǎng)”中。

谷歌每年運(yùn)行超過(guò)1萬(wàn)次A/B測(cè)試;

Facebook的CEO扎克伯格會(huì)親自參與眾多A/B測(cè)試的實(shí)施;

領(lǐng)英(LinkedIn)將A/B測(cè)試作為產(chǎn)品研發(fā)上線過(guò)程中的基本流程;

Booking.com通過(guò)大量試驗(yàn)實(shí)現(xiàn)超過(guò)同行業(yè)2~3倍的轉(zhuǎn)化率;

亞馬遜稱自己為“A/B測(cè)試公司”,在前期推廣信用卡廣告時(shí)憑借A/B測(cè)試帶來(lái)了年化上億美元的營(yíng)收增長(zhǎng)。

為什么大批互聯(lián)網(wǎng)頭部企業(yè)都將A/B測(cè)試奉為圭臬?

首先,A/B測(cè)試使企業(yè)真正實(shí)現(xiàn)了科學(xué)決策。

很多決策往往很難依靠個(gè)人的洞察力來(lái)“拍腦袋”決定,只能依靠數(shù)據(jù)說(shuō)話。微軟必應(yīng)(bing)曾經(jīng)做過(guò)一個(gè)A/B測(cè)試的優(yōu)化,僅僅對(duì)搜索結(jié)果內(nèi)容的顏色做了幾行代碼的調(diào)整,肉眼幾乎無(wú)法看出區(qū)別,但用戶點(diǎn)擊率大幅提高,廣告收益增加了1000多萬(wàn)美元。

A/B測(cè)試給企業(yè)帶來(lái)的另一大價(jià)值是規(guī)避風(fēng)險(xiǎn)。

火山引擎A/B測(cè)試產(chǎn)品架構(gòu)師李想告訴「甲子光年」,產(chǎn)品迭代往往需要一定的間隔期,一旦方案做錯(cuò)了,失去的不僅是一個(gè)方案,還有半個(gè)或一個(gè)月的時(shí)間窗口。其次,如果某個(gè)方案會(huì)對(duì)企業(yè)業(yè)務(wù)帶來(lái)負(fù)面影響,A/B測(cè)試能夠?qū)⑵?ldquo;扼殺在搖籃”。

科學(xué)決策和風(fēng)險(xiǎn)規(guī)避最終確保了企業(yè)的每個(gè)決策都能帶來(lái)正向收益,持續(xù)循環(huán)下,公司將實(shí)現(xiàn)復(fù)利式增長(zhǎng)。

2010年起,隨著以美團(tuán)、滴滴、字節(jié)跳動(dòng)為代表的中國(guó)本土互聯(lián)網(wǎng)公司崛起,A/B測(cè)試西風(fēng)東漸,逐漸成為企業(yè)決策的一項(xiàng)重要工具。

為了更方便地進(jìn)行A/B測(cè)試,國(guó)內(nèi)的大型互聯(lián)網(wǎng)公司也像谷歌一樣建立了自己的A/B測(cè)試平臺(tái),比如滴滴阿波羅、今日頭條Libra、美團(tuán)點(diǎn)評(píng)Gemini。

其中,張一鳴可以說(shuō)是A/B測(cè)試的頭號(hào)擁躉。2016年在接受媒體采訪時(shí)張一鳴以取名舉例,多數(shù)團(tuán)隊(duì)有了好名字之后會(huì)說(shuō),“這個(gè)名字很好,干杯!”而張一鳴會(huì)說(shuō),再做個(gè)AB測(cè)試吧,哪怕你99.9%正確,測(cè)一下又有什么關(guān)系呢?

放眼整個(gè)互聯(lián)網(wǎng)圈,A/B測(cè)試幾乎成為了優(yōu)秀企業(yè)的標(biāo)配。

火山引擎是如何用A/B測(cè)試承載其數(shù)據(jù)驅(qū)動(dòng)理念的?

成功使用A/B測(cè)試的企業(yè)代表,圖片來(lái)自《A/B測(cè)試,創(chuàng)新始于試驗(yàn)》一書(shū)

不過(guò),盡管A/B測(cè)試的價(jià)值顯而易見(jiàn),但仍然局限在頭部互聯(lián)網(wǎng)圈子,在更廣泛的企業(yè)圈層,國(guó)內(nèi)的普及程度并不高。

供給缺失,需求緊迫

為什么A/B測(cè)試止于互聯(lián)網(wǎng)頭部企業(yè)?第一個(gè)原因是存在較高的技術(shù)壁壘。

分流是A/B測(cè)試的基礎(chǔ)門檻,企業(yè)需要建立靠譜的A/B測(cè)試平臺(tái),保證科學(xué)的流量分割、流量層直接的正交互斥,使得實(shí)驗(yàn)不受干擾。

比如一個(gè)在生活中常見(jiàn)的現(xiàn)象:從下表看出,盡管兩個(gè)學(xué)院男生錄取率都高于女生,但綜合考慮兩個(gè)學(xué)院的情況時(shí),男生的總體錄取率卻要低于女生。

火山引擎是如何用A/B測(cè)試承載其數(shù)據(jù)驅(qū)動(dòng)理念的?

這種現(xiàn)象在統(tǒng)計(jì)學(xué)中被稱為辛普森悖論[1]。如果實(shí)驗(yàn)組和對(duì)照組的樣本流量分布不一致,就可能產(chǎn)生辛普森悖論。

不科學(xué)的分流在企業(yè)中也很常見(jiàn)。李想告訴「甲子光年」,在做A/B測(cè)試時(shí),有的客戶會(huì)用手機(jī)尾號(hào)對(duì)用戶分流,但人們都喜歡尾數(shù)為6和8的號(hào)碼,號(hào)碼并非平均分布;有的客戶會(huì)在小米和華為的應(yīng)用商店做分流,但兩家的調(diào)性本來(lái)就不同。

其次,A/B實(shí)驗(yàn)平臺(tái)的指標(biāo)設(shè)計(jì)和解讀、置信度的統(tǒng)計(jì)方法,需要投入的研發(fā)資源也很高。如果實(shí)驗(yàn)做不好,可能會(huì)帶來(lái)南轅北轍的結(jié)果。

這種高技術(shù)門檻也就導(dǎo)致了高成本,只有少部分頭部互聯(lián)網(wǎng)企業(yè)能夠成為A/B測(cè)試的應(yīng)用者。非互聯(lián)網(wǎng)企業(yè)和其他中小互聯(lián)網(wǎng)企業(yè)雖然可以使用第三方工具來(lái)代替自建,但市面上有實(shí)力的服務(wù)商寥寥無(wú)幾。

一邊是供給的缺失,另一邊卻是需求的緊迫。

在抖音、快手為代表的短視頻平臺(tái)之后,新的流量平臺(tái)尚未形成。智能汽車或許是新的流量終端,但要想成規(guī)模估計(jì)也是2025年之后的事情。

流量紅利見(jiàn)頂、流量越來(lái)越貴,過(guò)去跑馬圈地、粗放式經(jīng)營(yíng)的時(shí)代一去不復(fù)返,企業(yè)普遍陷入“增長(zhǎng)的煩惱”。

而A/B測(cè)試正好能滿足這樣的增長(zhǎng)需求,這也是火山引擎看到的市場(chǎng)機(jī)遇。

從“獨(dú)樂(lè)樂(lè)”到“眾樂(lè)樂(lè)”

和很多創(chuàng)業(yè)公司先做產(chǎn)品可行性驗(yàn)證(mvp)再大規(guī)模推向市場(chǎng)不同的是,火山引擎的A/B測(cè)試早已在字節(jié)跳動(dòng)旗下的今日頭條、抖音等產(chǎn)品中走完了產(chǎn)品驗(yàn)證階段。

早在2012年成立之初,張一鳴就在內(nèi)部使用A/B測(cè)試,2016年升級(jí)、進(jìn)化為內(nèi)部廣泛使用的平臺(tái)——Libra,2018年開(kāi)始服務(wù)少數(shù)外部的種子客戶,2020年通過(guò)火山引擎正式對(duì)外商業(yè)化。

今年4月26日,在火山引擎舉辦的一場(chǎng)A/B測(cè)試為主題的技術(shù)開(kāi)放日上,字節(jié)跳動(dòng)副總裁楊震原透露:字節(jié)跳動(dòng)現(xiàn)在每天大概新增1500個(gè)實(shí)驗(yàn),服務(wù)了400多項(xiàng)業(yè)務(wù),累計(jì)已經(jīng)做了70萬(wàn)次實(shí)驗(yàn)。

火山引擎是如何用A/B測(cè)試承載其數(shù)據(jù)驅(qū)動(dòng)理念的?

字節(jié)跳動(dòng)副總裁楊震原

火山引擎的A/B測(cè)試經(jīng)歷了字節(jié)跳動(dòng)多年的打磨,積累了非常成熟的技術(shù)基礎(chǔ),這體現(xiàn)在很多方面,比如實(shí)驗(yàn)自動(dòng)分流、流量正交互斥、指標(biāo)設(shè)計(jì)和解讀、置信度統(tǒng)計(jì)等。

準(zhǔn)確的分流是A/B測(cè)試的基礎(chǔ)門檻,一旦數(shù)據(jù)分流出現(xiàn)失誤,A/B測(cè)試的結(jié)果就毫無(wú)科學(xué)性可言。在這點(diǎn)上,火山引擎的客戶深有體會(huì)。

在與火山引擎合作之前,蝸牛睡眠也曾嘗試過(guò)以自研的方式來(lái)進(jìn)行A/B測(cè)試,例如測(cè)試新用戶的價(jià)格敏感度,但是結(jié)果并不準(zhǔn)確。蝸牛睡眠CTO竹東翔分析后發(fā)現(xiàn),這是做對(duì)照試驗(yàn)時(shí)有多個(gè)變量,無(wú)法在同一時(shí)間對(duì)流量做精準(zhǔn)分流而導(dǎo)致。

除此之外,蝸牛睡眠還有一個(gè)特殊需求。從2017年起,蝸牛睡眠就在使用一家軟件公司的數(shù)據(jù)埋點(diǎn)服務(wù)。如今,隨著數(shù)據(jù)量越來(lái)越大,單機(jī)版的算力已經(jīng)不能滿足需求,必須要升級(jí)到更高算力的集群版。

竹東翔告訴「甲子光年」,要讓專業(yè)的人干專業(yè)的事。因此,蝸牛睡眠放棄了自研A/B測(cè)試工具的方案,開(kāi)始在市場(chǎng)上尋找服務(wù)商,要同時(shí)滿足精準(zhǔn)分流,以及數(shù)據(jù)遷移。

在對(duì)比多家供應(yīng)商之后,竹東翔最終選擇了火山引擎的A/B測(cè)試工具。“這不僅僅是因?yàn)榛鹕揭鎯?yōu)秀的底層分流能力,也源于火山引擎在指標(biāo)的設(shè)計(jì)解讀、置信度統(tǒng)計(jì)方法等方面。對(duì)于一款A(yù)/B產(chǎn)品來(lái)說(shuō),這些看似簡(jiǎn)單的細(xì)節(jié)實(shí)則更加考驗(yàn)產(chǎn)品實(shí)力。”他表示。

另外,火山引擎也結(jié)合了用戶的不同需求,在產(chǎn)品中融入了大量特殊實(shí)驗(yàn),比如可視化實(shí)驗(yàn)、Push實(shí)驗(yàn),甚至應(yīng)用貝葉斯原理的動(dòng)態(tài)調(diào)優(yōu)實(shí)驗(yàn)等等,將產(chǎn)品進(jìn)一步向場(chǎng)景化、智能化發(fā)展,滿足客戶更為復(fù)雜的業(yè)務(wù)需求。

火山引擎是如何用A/B測(cè)試承載其數(shù)據(jù)驅(qū)動(dòng)理念的?

如今,蝸牛睡眠已經(jīng)在火山引擎的支持下做了3個(gè)版本的迭代,每次都做3~5個(gè)平行試驗(yàn),效果也是立竿見(jiàn)影。在其中的一個(gè)版本中,蝸牛睡眠的用戶時(shí)長(zhǎng)等數(shù)據(jù)相比之前提高了整整一倍。

火山引擎成熟的產(chǎn)品能力也為其帶來(lái)了客戶粘性。李想就遇到這樣一個(gè)客戶,從初次接觸火山引擎至今,雖然經(jīng)歷了數(shù)次工作變動(dòng),他仍然推薦并影響所在的團(tuán)隊(duì)繼續(xù)使用火山引擎A/B測(cè)試。

目前,火山引擎已經(jīng)服務(wù)了包括京東、蘇寧、建設(shè)銀行、銀河證券、福特、B站、華潤(rùn)、虎撲、vivo等多個(gè)行業(yè)知名企業(yè)。

理念輻射

盡管價(jià)值顯性,但“A/B測(cè)試并不賺錢”,譚待對(duì)「甲子光年」表示,“如果僅從收入來(lái)看,A/B測(cè)試給火山引擎帶來(lái)的收入甚至算不上核心產(chǎn)品。”

但A/B測(cè)試是火山引擎數(shù)據(jù)驅(qū)動(dòng)理念的最佳代表,是落實(shí)數(shù)據(jù)驅(qū)動(dòng)的最佳工具。相比收入,理念的落實(shí),進(jìn)而輻射、滲透到企業(yè)的骨髓、血脈中,才是A/B測(cè)試更大的價(jià)值。

順著理念輻射的線,火山引擎希望將字節(jié)跳動(dòng)積累九年的技術(shù)能力、增長(zhǎng)方法論,更多輸出到行業(yè)、企業(yè)中。

火山引擎品牌發(fā)布會(huì)上,譚待詳細(xì)介紹了字節(jié)跳動(dòng)對(duì)外輸出的能力。

首先是增長(zhǎng)方法。過(guò)去九年,字節(jié)跳動(dòng)沉淀了很多增長(zhǎng)的方法和經(jīng)驗(yàn),包括創(chuàng)意生產(chǎn)和內(nèi)容創(chuàng)造、千人千面的個(gè)性化匹配、精細(xì)化用戶運(yùn)營(yíng)等。

其次是工具。好的方法和流程,都需要工具進(jìn)行固化。在字節(jié)內(nèi)部有數(shù)千人的工具研發(fā)團(tuán)隊(duì),這些工具都通過(guò)火山引擎對(duì)外開(kāi)放。

有了方法和工具,還需要技術(shù)能力來(lái)支持業(yè)務(wù)發(fā)展。火山引擎把抖音、今日頭條等全系產(chǎn)品上的同款技術(shù)拿出來(lái),包括基礎(chǔ)服務(wù)能力、個(gè)性化推薦算法、音視頻的理解和處理等技術(shù),幫助企業(yè)更好地觸達(dá)用戶和提升互動(dòng)體驗(yàn)。

綜合方法、工具和平臺(tái),火山引擎提供了一套全鏈路的技術(shù)方案,一整套智能增長(zhǎng)技術(shù)。

火山引擎是如何用A/B測(cè)試承載其數(shù)據(jù)驅(qū)動(dòng)理念的?

至此,字節(jié)跳動(dòng)在to B領(lǐng)域已經(jīng)組建起飛書(shū)、巨量引擎、火山引擎三架馬車。其中,飛書(shū)負(fù)責(zé)企業(yè)協(xié)同與組織,幫助解決企業(yè)的“內(nèi)事”;巨量引擎負(fù)責(zé)廣告業(yè)務(wù),把字節(jié)App矩陣的流量變現(xiàn);火山引擎負(fù)責(zé)技術(shù)輸出,幫助企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型。

中國(guó)的to B市場(chǎng)競(jìng)爭(zhēng)激烈,字節(jié)跳動(dòng)憑借三駕馬車躬身入局。我們已經(jīng)見(jiàn)證了字節(jié)跳動(dòng)在消費(fèi)互聯(lián)網(wǎng)時(shí)代崛起,如今繼續(xù)在to B領(lǐng)域深耕,有望成為產(chǎn)業(yè)互聯(lián)網(wǎng)的一顆新星。

END.

[1] 辛普森悖論由英國(guó)統(tǒng)計(jì)學(xué)家E.H辛普森于1951年提出。其主要內(nèi)容是:幾組不同的數(shù)據(jù)中均存在一種趨勢(shì),但當(dāng)這些數(shù)據(jù)組合在一起后,這種趨勢(shì)消失或反轉(zhuǎn)。其產(chǎn)生的原因主要是數(shù)據(jù)中存在多個(gè)變量。這些變量通常難以識(shí)別,被稱為“潛伏變量”。潛伏變量可能是由于采樣錯(cuò)誤造成的。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )