在信息爆炸的時代,我們面對的選擇越來越多。內(nèi)容提供商們,比如音樂電臺、視頻流媒體、應(yīng)用商店等,常常把內(nèi)容分成不同的類型,以供用戶們選擇。不過,類型常常是一種寬泛的分類,并不能完全滿足用戶個性需求,而且類型區(qū)分過細的話,常常使人無所適從。
在這種情況下,智能推薦開始出現(xiàn)了。得益于計算機技術(shù)的進步,內(nèi)容提供商能夠?qū)τ脩舻膼酆米龀龈鼮榧氈碌姆治觯瑥亩龀龈觽€性化的推薦。通過對Netflix影片分類的深入分析,以及采訪Netflix產(chǎn)品副總裁,Atlantic網(wǎng)站的Alexis C. Madrigal揭示了Netflix影視推薦背后的真相。
Netflix推薦影片的時候,會給出一個非常細致的類型,或者說是一種“微類型”.Alexis 想要整理出一份完整的微類型列表。由于Netflix的微類型多得離譜,他不得不借助于自動處理軟件。在計算機連續(xù)運作一天之后,他看到了Netflix微類型的數(shù)量:76897個。這些微類型是由一些基本要素構(gòu)成的,基本語法是這樣:
地區(qū)+形容詞+類型(名詞) +基于……+……為背景+來自……+關(guān)于……+從 X 歲到 Y 歲
(Region + Adjectives + Noun Genre + Based On… + Set In… + From the… + About… + For Age X to Y)
當(dāng)然,有些微類型是不符合上述語法的,比如“有強勢女主角”和“適合無可救藥的浪漫主義者。”
在同事Ian Bogost 的建議下,Alexis還編寫了一個類型生成器,試圖理解Netflix的算法究竟是什么樣子的。不過,他還是感覺沒有看到全貌。于是,他聯(lián)系了Netflix,并見到了公司的產(chǎn)品副總裁Todd Yellin,那個創(chuàng)建了 Netflix 推薦系統(tǒng)的人。
在接受采訪的時候,Todd Yellin說,他早就等著人們來問這個問題了。為所有的電影加上標簽,正是他的主意,而他還自己寫了一張24頁的文檔,講述加標簽的方法。他為早期的一些電影加過標簽,而且主導(dǎo)了整個系統(tǒng)的創(chuàng)建過程。
“我的第一個任務(wù)是:把內(nèi)容撕裂開來!”他說。
2006 年,Yellin組織了十幾個工程師,花費數(shù)月時間編寫一份名為“Netflix 量子理論”的文檔。當(dāng)時,他把組成影片的基本元素稱作“量子”.如今,他更喜歡“微標簽”的說法,因為現(xiàn)在看來,“量子理論”是一個自命不凡的名字。
這份文檔描述了為影片各種層面加標簽的方法,涉及到影片結(jié)尾、主角的“社會接受程度”等等方面。標簽是帶標量的,從1到5,就是說,所有的影片都有一個“浪漫程度”的標示,而不僅僅是那些表明是“浪漫片”的電影。每個電影的結(jié)局都有打分,從幸福到悲傷。每個情節(jié)都有標簽。主角的工作有標簽。影片的地點有標簽。
Netflix的工程師以“微標簽”為基礎(chǔ),創(chuàng)造了一種語法,來生成各種類型。這是一種人工和機器算法的結(jié)合。Netflix 的做法,與 Pandora 的音樂基金組計劃有些類似,但是 Netflix 不僅僅展示給你喜歡的內(nèi)容,還能夠?qū)ζ溥M行文字描述。
這些標簽數(shù)據(jù)不僅僅用來生成類型,也用來增加推薦的個性化程度。如果你喜歡動作冒險類電影,并且浪漫程度比較高的,Netflix 可以推薦給你。“我們將對影片中的浪漫程度做出標注。我們不會告訴你它有多浪漫,但是我們會推薦它,”Yellin 說,“你會看到動作場面,里面的浪漫程度如何,那取決于我們對你的了解。”
在采訪結(jié)束之前,Alexis 向Yellin展示了一個有趣的圖表。Netflix上最受歡迎的演員排名中,占據(jù)第一名的是Raymond Burr,50 年代電視劇Perry Mason的主演,而占據(jù)第七名的是Barbara Hale,在劇中扮演主演的秘書。為什么這兩個人能夠超過梅麗爾·斯特里普、塞繆爾·杰克遜、尼古拉斯·凱奇和肖恩·康納利?
這是一個謎題。即使是Yellin也搞不懂,為什么他們的名字出現(xiàn)在那么多的“微類型”中。這是無法用邏輯來解釋的問題。
“讓我們做些哲學(xué)思考吧。在人類社會中,生命由于意外而變得有趣。”他說,“當(dāng)你把復(fù)雜的東西添加到機器的世界時,你也在添加自己無法想象的意外。Perry Mason就會發(fā)生。這些機器中的鬼魂,經(jīng)常是復(fù)雜帶來的副產(chǎn)品。有時候我們稱它為失誤,有時候我們稱之為特色。”
- 抖音封禁汪小菲賬號引熱議,哪吒客服遭曝光,網(wǎng)絡(luò)文明需共建
- 三星中國換帥:崔勝植黯然退場,李大成能否翻盤引人關(guān)注
- Steam Machine前景不明,AMD合作驅(qū)動改進成疑,Valve如何應(yīng)對?
- OpenAI疑似數(shù)據(jù)泄露,用戶隱私岌岌可危,公司緊急調(diào)查
- Meta被指大規(guī)模下載盜版電子書用于AI模型訓(xùn)練,侵犯知識產(chǎn)權(quán)引爭議
- 車市重燃價格戰(zhàn):開年車市“卷瘋”了,消費者迎來購車新格局
- 寶駿汽車深度融合新技術(shù),DeepSeek助力汽車駛向未來
- 哪吒汽車客服錄音風(fēng)波:車主怒懟下爆粗口辱罵,公司道歉引熱議
- 索尼集團高層變動:十時裕樹接棒成為新CEO,重塑公司管理架構(gòu)
- iPhone神話在華失寵:銷量下滑,市場份額萎縮,時代變遷?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。