近日,一款音頻社交APP突然爆紅網(wǎng)絡(luò),強勢吸引大批iOS用戶下載注冊并引起微博等社交媒體平臺的大量討論,這款A(yù)PP就是——Clubhouse。
圖片來源:Neil Patel
Clubhouse在中文網(wǎng)絡(luò)世界的爆火可以追溯到2021年的1月,Elon Musk在社交媒體發(fā)文稱將在北京時間2月1號在Clubhouse上創(chuàng)建聊天室,這一消息迅速引爆國內(nèi)外的社交媒體。Elon Musk的大名可謂無人不知不人不曉,電動車、火箭、腦機接口等一系列關(guān)鍵詞讓坐擁Tesla、SpaceX的他不僅是成功的企業(yè)家,同時也是這個時代最具夢幻意義的創(chuàng)新領(lǐng)袖、科技偶像和巨量網(wǎng)紅,更不必提近期他還一度登上世界首富寶座。那么,如果有一個機會能聽到Musk和其他一些世界上最頂級的頭腦們聊天,想必有大批人不愿錯過。
自此,被Musk引流至服務(wù)器一度崩潰的Clubhouse成功進入大眾視野。但Clubhouse能持續(xù)成功的原因,不僅僅在這一次現(xiàn)象級的社會性事件。
從“club+house”這個直白的名字組成上不難看出,Clubhouse提供的主要服務(wù)形式是多人語音在線聊天,為人們在線上“club”談天說地提供“house”。在疫情尚不明朗、居家隔離仍被提倡的國際大環(huán)境下,在美區(qū)APP store會誕生這樣一款呼應(yīng)居家人群語音社交需求的APP也并不令人意外。同時,Clubhouse的處處“克制”的設(shè)計又將其打造成一款與眾不同的語音社交軟件。
Clubhouse采用了克制的邀請注冊機制,普通用戶可先行搶注自己的ID,但仍需要邀請碼來完成完整注冊過程以正常使用。這樣保證了初期用戶對交互形式的興趣程度、接受程度以及熟人社交關(guān)系網(wǎng),同時也在某種意義上進行了用戶過濾,保證了優(yōu)質(zhì)程度。
其次在推薦機制上,Clubhouse采取“熟人關(guān)系+興趣探索”的模式,可以讓用戶迅速發(fā)現(xiàn)自己好友的興趣并探索自己喜歡的房間。而最為克制、與其他IM產(chǎn)品最為不同的是Clubhouse沒有任何文本輸入框,每一個聊天室中只有純粹的語音溝通,普通聽眾除非舉手并被主持人允許否則不能發(fā)言,而且聽眾的離開也不會告知主持人和發(fā)言嘉賓,這就保證了整個聊天室內(nèi)的討論和發(fā)言幾乎不受任何外力影響,討論氛圍與思考過程不受聽眾評論和發(fā)言的影響,保證了內(nèi)容層面的高質(zhì)量。在各大互聯(lián)網(wǎng)企業(yè)都在想盡辦法提高APP使用者參與度的今天,這樣一款重視交互和內(nèi)容、小而精的APP顯得不那么“入流”,卻又脫穎而出。
但事物往往具有兩面性,孟德斯鳩曾說:“自由不是無限制的自由。”
由于缺乏相關(guān)經(jīng)驗,作為新生產(chǎn)品的Clubhouse顯然在中國遭遇了“水土不服”。內(nèi)容監(jiān)管的缺失讓這款A(yù)PP幾度出現(xiàn)風(fēng)險內(nèi)容的討論房間,幾經(jīng)周折最終被暫停服務(wù)。
自此,爆火中文社交網(wǎng)絡(luò)的Clubhouse熱度大減,不復(fù)往日繁榮。
可見,風(fēng)險內(nèi)容監(jiān)管已經(jīng)逐步成為語音社交軟件存亡的生命線,語音內(nèi)容中極有可能混有涉黃、涉暴、涉恐、涉政等敏感信息,對網(wǎng)絡(luò)環(huán)境純凈造成威脅,語音內(nèi)容審核成為了社交平臺的新難題。
數(shù)美科技發(fā)現(xiàn),語音審核除了要識別音頻包含的文本內(nèi)容是否涉及敏感信息,同時還存在語音語調(diào)上的擬聲詞、感嘆詞和語氣詞的審核難度,例如涉及色情信息的嬌喘、呻吟等。這為語音審核提出了更高的挑戰(zhàn)。目前普遍采用的人工審核方式雖然能夠提供較好的審核能力,但需要對音頻文件進行整段察驗,對音頻流進行實時監(jiān)控,造成了較高的時間成本和人力投入。
對此,數(shù)美科技旗下的全棧式智能內(nèi)容識別產(chǎn)品“天凈”,能夠通過智能音頻過濾技術(shù)提供強有力的音頻內(nèi)容識別支持。智能音頻過濾技術(shù)采用基于ffmpeg的音頻信息動態(tài)轉(zhuǎn)碼技術(shù)、基于深度學(xué)習(xí)的語音識別技術(shù)和智能特色語義分析技術(shù),能夠?qū)^大部分音頻格式進行多場景、多維度地檢測與識別。其中包括涉政、涉黃、廣告導(dǎo)流等諸多類型。智能音頻過濾產(chǎn)品識別準(zhǔn)確率高,處理速度快,檢測場景廣泛,支持中英雙語種,能夠極大降低人工審核成本,提升音頻內(nèi)容質(zhì)量。
音頻內(nèi)容識別組成
在語音內(nèi)容獲取上,數(shù)美科技的智能音頻過濾技術(shù)支持OGG、MP3、ASF、WMA、WAV、MP3PRO、RM、REAL、APE、MODULE、MIDI、VQF等多種音頻格式和音頻流,能夠應(yīng)對不同語音內(nèi)容提供平臺使用的常用音頻格式,同時支持語音直播實時監(jiān)控、語音點播、語音消息和各種音頻文件的檢測。
在獲取到待檢測的音頻文件和音頻流后,主要從四個方面進行內(nèi)容的檢測識別:
1.涉政違規(guī)利用語音轉(zhuǎn)文本技術(shù)將語音信息轉(zhuǎn)為文本信息,再通過成熟的文本內(nèi)容檢測,對音頻中出現(xiàn)的多種類型政治違規(guī)內(nèi)容進行檢測。
2.涉黃違規(guī)利用大規(guī)模GPU集群的計算能力和深度學(xué)習(xí)技術(shù),準(zhǔn)確快速穩(wěn)定地識別音頻中出現(xiàn)的色情,低俗或性感部分,在管理后臺對其進行標(biāo)注和反饋,從而大規(guī)模提升人工審核團隊效率,增強用戶瀏覽體驗。
3.特殊聲音識別同樣利用大規(guī)模GPU集群的強大計算能力和深度機器學(xué)習(xí)的技術(shù),除了一般的涉黃違規(guī)語言內(nèi)容,還能準(zhǔn)確識別出呻吟等非文本類的特殊聲音。
4.導(dǎo)流廣告通過語音轉(zhuǎn)文本技術(shù)將語音信息轉(zhuǎn)為文本信息,對文本內(nèi)容進行關(guān)鍵詞檢測,識別出潛在的添加微信號、QQ號、QQ群以及虛假信息等導(dǎo)流廣告音頻內(nèi)容。
經(jīng)過測試,智能音頻過濾技術(shù)對問題音頻判斷的正確率以及反饋問題音頻的正確率均高于90%。在提供高正確率的音頻過濾結(jié)果的同時,此套解決方案還提供了非常高的處理效率,智能音頻過濾API的最大響應(yīng)時間為1s,超時率低于0.01%,實時率可達(dá)到30%。而智能音頻過濾API也具有深厚的處理容量,最大支持并發(fā)100路處理任務(wù),還可根據(jù)需求水平擴展。
數(shù)美科技音頻內(nèi)容風(fēng)控方案
同時,數(shù)美科技為“天凈”賦予了豐富多樣的標(biāo)簽體系,對涉黃、涉暴、涉恐、涉政、廣告導(dǎo)流等不同敏感信息進行詳細(xì)分類,以滿足不同程度、不同種類、不同特點的識別需求。而數(shù)美強大標(biāo)簽體系亦成功成為了多家社交平臺進行風(fēng)險內(nèi)容審核的尺度參考,為新生產(chǎn)品提供了可靠強力的內(nèi)容風(fēng)控基礎(chǔ)。
智能音頻識別還整合了業(yè)界一流的語音識別技術(shù)、大規(guī)模GPU計算的深度學(xué)習(xí)、基于敏感詞庫的名單服務(wù)、特殊聲音識別模型、基于深度學(xué)習(xí)的NLP模型以及實時分布式規(guī)則引擎等。其中深度學(xué)習(xí)模型能夠讓系統(tǒng)從多個維度檢測語義環(huán)境,準(zhǔn)確識別說話意圖。而智能音頻識別技術(shù)根據(jù)不同場景和行業(yè)采用了專門化的判斷策略,結(jié)合強大的標(biāo)簽體系能夠為不同類型社交平臺提供定制化的過濾服務(wù)。
高效準(zhǔn)確的識別算法、廣泛多樣的格式支持、細(xì)致強大的判定能力以及不同用戶的精細(xì)化方案,數(shù)美科技持續(xù)為音頻內(nèi)容平臺客戶提供高效準(zhǔn)確的音頻內(nèi)容風(fēng)控方案。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )