數(shù)美科技解讀 | 絢爛如煙花,“Clubhouse們”如何才能持續(xù)綻放?

近日,一款音頻社交APP突然爆紅網(wǎng)絡(luò),強(qiáng)勢吸引大批iOS用戶下載注冊并引起微博等社交媒體平臺(tái)的大量討論,這款A(yù)PP就是——Clubhouse。

數(shù)美科技解讀

圖片來源:Neil Patel

Clubhouse在中文網(wǎng)絡(luò)世界的爆火可以追溯到2021年的1月,Elon Musk在社交媒體發(fā)文稱將在北京時(shí)間2月1號在Clubhouse上創(chuàng)建聊天室,這一消息迅速引爆國內(nèi)外的社交媒體。Elon Musk的大名可謂無人不知不人不曉,電動(dòng)車、火箭、腦機(jī)接口等一系列關(guān)鍵詞讓坐擁Tesla、SpaceX的他不僅是成功的企業(yè)家,同時(shí)也是這個(gè)時(shí)代最具夢幻意義的創(chuàng)新領(lǐng)袖、科技偶像和巨量網(wǎng)紅,更不必提近期他還一度登上世界首富寶座。那么,如果有一個(gè)機(jī)會(huì)能聽到Musk和其他一些世界上最頂級的頭腦們聊天,想必有大批人不愿錯(cuò)過。

自此,被Musk引流至服務(wù)器一度崩潰的Clubhouse成功進(jìn)入大眾視野。但Clubhouse能持續(xù)成功的原因,不僅僅在這一次現(xiàn)象級的社會(huì)性事件。

從“club+house”這個(gè)直白的名字組成上不難看出,Clubhouse提供的主要服務(wù)形式是多人語音在線聊天,為人們在線上“club”談天說地提供“house”。在疫情尚不明朗、居家隔離仍被提倡的國際大環(huán)境下,在美區(qū)APP store會(huì)誕生這樣一款呼應(yīng)居家人群語音社交需求的APP也并不令人意外。同時(shí),Clubhouse的處處“克制”的設(shè)計(jì)又將其打造成一款與眾不同的語音社交軟件。

Clubhouse采用了克制的邀請注冊機(jī)制,普通用戶可先行搶注自己的ID,但仍需要邀請碼來完成完整注冊過程以正常使用。這樣保證了初期用戶對交互形式的興趣程度、接受程度以及熟人社交關(guān)系網(wǎng),同時(shí)也在某種意義上進(jìn)行了用戶過濾,保證了優(yōu)質(zhì)程度。

其次在推薦機(jī)制上,Clubhouse采取“熟人關(guān)系+興趣探索”的模式,可以讓用戶迅速發(fā)現(xiàn)自己好友的興趣并探索自己喜歡的房間。而最為克制、與其他IM產(chǎn)品最為不同的是Clubhouse沒有任何文本輸入框,每一個(gè)聊天室中只有純粹的語音溝通,普通聽眾除非舉手并被主持人允許否則不能發(fā)言,而且聽眾的離開也不會(huì)告知主持人和發(fā)言嘉賓,這就保證了整個(gè)聊天室內(nèi)的討論和發(fā)言幾乎不受任何外力影響,討論氛圍與思考過程不受聽眾評論和發(fā)言的影響,保證了內(nèi)容層面的高質(zhì)量。在各大互聯(lián)網(wǎng)企業(yè)都在想盡辦法提高APP使用者參與度的今天,這樣一款重視交互和內(nèi)容、小而精的APP顯得不那么“入流”,卻又脫穎而出。

但事物往往具有兩面性,孟德斯鳩曾說:“自由不是無限制的自由。”

由于缺乏相關(guān)經(jīng)驗(yàn),作為新生產(chǎn)品的Clubhouse顯然在中國遭遇了“水土不服”。內(nèi)容監(jiān)管的缺失讓這款A(yù)PP幾度出現(xiàn)風(fēng)險(xiǎn)內(nèi)容的討論房間,幾經(jīng)周折最終被暫停服務(wù)。

自此,爆火中文社交網(wǎng)絡(luò)的Clubhouse熱度大減,不復(fù)往日繁榮。

可見,風(fēng)險(xiǎn)內(nèi)容監(jiān)管已經(jīng)逐步成為語音社交軟件存亡的生命線,語音內(nèi)容中極有可能混有涉黃、涉暴、涉恐、涉政等敏感信息,對網(wǎng)絡(luò)環(huán)境純凈造成威脅,語音內(nèi)容審核成為了社交平臺(tái)的新難題。

數(shù)美科技發(fā)現(xiàn),語音審核除了要識別音頻包含的文本內(nèi)容是否涉及敏感信息,同時(shí)還存在語音語調(diào)上的擬聲詞、感嘆詞和語氣詞的審核難度,例如涉及色情信息的嬌喘、呻吟等。這為語音審核提出了更高的挑戰(zhàn)。目前普遍采用的人工審核方式雖然能夠提供較好的審核能力,但需要對音頻文件進(jìn)行整段察驗(yàn),對音頻流進(jìn)行實(shí)時(shí)監(jiān)控,造成了較高的時(shí)間成本和人力投入。

對此,數(shù)美科技旗下的全棧式智能內(nèi)容識別產(chǎn)品“天凈”,能夠通過智能音頻過濾技術(shù)提供強(qiáng)有力的音頻內(nèi)容識別支持。智能音頻過濾技術(shù)采用基于ffmpeg的音頻信息動(dòng)態(tài)轉(zhuǎn)碼技術(shù)、基于深度學(xué)習(xí)的語音識別技術(shù)和智能特色語義分析技術(shù),能夠?qū)^大部分音頻格式進(jìn)行多場景、多維度地檢測與識別。其中包括涉政、涉黃、廣告導(dǎo)流等諸多類型。智能音頻過濾產(chǎn)品識別準(zhǔn)確率高,處理速度快,檢測場景廣泛,支持中英雙語種,能夠極大降低人工審核成本,提升音頻內(nèi)容質(zhì)量。

數(shù)美科技解讀

音頻內(nèi)容識別組成

在語音內(nèi)容獲取上,數(shù)美科技的智能音頻過濾技術(shù)支持OGG、MP3、ASF、WMA、WAV、MP3PRO、RM、REAL、APE、MODULE、MIDI、VQF等多種音頻格式和音頻流,能夠應(yīng)對不同語音內(nèi)容提供平臺(tái)使用的常用音頻格式,同時(shí)支持語音直播實(shí)時(shí)監(jiān)控、語音點(diǎn)播、語音消息和各種音頻文件的檢測。

在獲取到待檢測的音頻文件和音頻流后,主要從四個(gè)方面進(jìn)行內(nèi)容的檢測識別:

1.涉政違規(guī)利用語音轉(zhuǎn)文本技術(shù)將語音信息轉(zhuǎn)為文本信息,再通過成熟的文本內(nèi)容檢測,對音頻中出現(xiàn)的多種類型政治違規(guī)內(nèi)容進(jìn)行檢測。

2.涉黃違規(guī)利用大規(guī)模GPU集群的計(jì)算能力和深度學(xué)習(xí)技術(shù),準(zhǔn)確快速穩(wěn)定地識別音頻中出現(xiàn)的色情,低俗或性感部分,在管理后臺(tái)對其進(jìn)行標(biāo)注和反饋,從而大規(guī)模提升人工審核團(tuán)隊(duì)效率,增強(qiáng)用戶瀏覽體驗(yàn)。

3.特殊聲音識別同樣利用大規(guī)模GPU集群的強(qiáng)大計(jì)算能力和深度機(jī)器學(xué)習(xí)的技術(shù),除了一般的涉黃違規(guī)語言內(nèi)容,還能準(zhǔn)確識別出呻吟等非文本類的特殊聲音。

4.導(dǎo)流廣告通過語音轉(zhuǎn)文本技術(shù)將語音信息轉(zhuǎn)為文本信息,對文本內(nèi)容進(jìn)行關(guān)鍵詞檢測,識別出潛在的添加微信號、QQ號、QQ群以及虛假信息等導(dǎo)流廣告音頻內(nèi)容。

經(jīng)過測試,智能音頻過濾技術(shù)對問題音頻判斷的正確率以及反饋問題音頻的正確率均高于90%。在提供高正確率的音頻過濾結(jié)果的同時(shí),此套解決方案還提供了非常高的處理效率,智能音頻過濾API的最大響應(yīng)時(shí)間為1s,超時(shí)率低于0.01%,實(shí)時(shí)率可達(dá)到30%。而智能音頻過濾API也具有深厚的處理容量,最大支持并發(fā)100路處理任務(wù),還可根據(jù)需求水平擴(kuò)展。

數(shù)美科技解讀

數(shù)美科技音頻內(nèi)容風(fēng)控方案

同時(shí),數(shù)美科技為“天凈”賦予了豐富多樣的標(biāo)簽體系,對涉黃、涉暴、涉恐、涉政、廣告導(dǎo)流等不同敏感信息進(jìn)行詳細(xì)分類,以滿足不同程度、不同種類、不同特點(diǎn)的識別需求。而數(shù)美強(qiáng)大標(biāo)簽體系亦成功成為了多家社交平臺(tái)進(jìn)行風(fēng)險(xiǎn)內(nèi)容審核的尺度參考,為新生產(chǎn)品提供了可靠強(qiáng)力的內(nèi)容風(fēng)控基礎(chǔ)。

智能音頻識別還整合了業(yè)界一流的語音識別技術(shù)、大規(guī)模GPU計(jì)算的深度學(xué)習(xí)、基于敏感詞庫的名單服務(wù)、特殊聲音識別模型、基于深度學(xué)習(xí)的NLP模型以及實(shí)時(shí)分布式規(guī)則引擎等。其中深度學(xué)習(xí)模型能夠讓系統(tǒng)從多個(gè)維度檢測語義環(huán)境,準(zhǔn)確識別說話意圖。而智能音頻識別技術(shù)根據(jù)不同場景和行業(yè)采用了專門化的判斷策略,結(jié)合強(qiáng)大的標(biāo)簽體系能夠?yàn)椴煌愋蜕缃黄脚_(tái)提供定制化的過濾服務(wù)。

高效準(zhǔn)確的識別算法、廣泛多樣的格式支持、細(xì)致強(qiáng)大的判定能力以及不同用戶的精細(xì)化方案,數(shù)美科技持續(xù)為音頻內(nèi)容平臺(tái)客戶提供高效準(zhǔn)確的音頻內(nèi)容風(fēng)控方案。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )