向“音”而生 數(shù)美科技護(hù)航實(shí)時(shí)語(yǔ)音社交平臺(tái)發(fā)展

2021年初,音頻社交應(yīng)用Clubhouse迅速?zèng)_擊互聯(lián)網(wǎng)圈,在馬斯克入駐的名人效應(yīng)和自身獨(dú)特的邀請(qǐng)注冊(cè)與推薦機(jī)制雙重加持下,Clubhouse的討論迅速在中國(guó)火熱蔓延開(kāi)來(lái),“音頻社交”賽道引爆業(yè)界關(guān)注,國(guó)內(nèi)互聯(lián)網(wǎng)圈迅速開(kāi)啟軍備競(jìng)賽,抓住音頻社交領(lǐng)域的新機(jī)遇。

但值得所有即時(shí)性音頻社交平臺(tái)關(guān)注的是,Clubhouse在國(guó)內(nèi)的火爆猶如煙花般絢爛且短暫。由于信息智能管理的缺失,Clubhouse的討論房間多次出現(xiàn)風(fēng)險(xiǎn)內(nèi)容,幾經(jīng)周折最終在國(guó)內(nèi)被暫停服務(wù)。自此,爆火中文社交網(wǎng)絡(luò)的Clubhouse熱度大減,不復(fù)往日繁榮。

為了抓住音頻社交領(lǐng)域的新機(jī)遇,國(guó)內(nèi)互聯(lián)網(wǎng)圈迅速開(kāi)啟軍備競(jìng)賽,紛紛開(kāi)始嘗試打造國(guó)內(nèi)版的“Clubhouse”。 映客直播上線對(duì)話吧;金融信息服務(wù)提供商鯨準(zhǔn)推出Capital coffee;小米剛剛結(jié)束服務(wù)的即時(shí)通訊軟件米聊在幾天后即重新上線,打造與Clubhouse有高度相似的語(yǔ)音聊天軟件……

面臨的挑戰(zhàn)

實(shí)時(shí)語(yǔ)音社交平臺(tái),每天都會(huì)產(chǎn)出海量聊天信息,聊天內(nèi)容很容易失控,極有可能混有敏感信息和灰色內(nèi)容,不利于平臺(tái)業(yè)務(wù)的發(fā)展,對(duì)網(wǎng)絡(luò)環(huán)境造成威脅。由此可見(jiàn),敏感信息過(guò)濾已經(jīng)成為影響平臺(tái)業(yè)務(wù)發(fā)展的風(fēng)險(xiǎn)線,也必將成為語(yǔ)音社交平臺(tái)運(yùn)營(yíng)發(fā)展中的重要模塊。

面對(duì)海量增長(zhǎng)的音頻消費(fèi)和使用需求,音頻內(nèi)容審核迫在眉睫,但平臺(tái)的風(fēng)控系統(tǒng)往往會(huì)遇到以下兩大方面的困境:

1.敏感信息過(guò)濾

  人力投入成本高:音頻內(nèi)容數(shù)據(jù)量大,人工日均審核量有限

  實(shí)時(shí)響應(yīng)要求高:內(nèi)容復(fù)雜多元,及時(shí)響應(yīng)時(shí)事政策難度大

  培訓(xùn)投入成本高:人審理解能力參差不齊,培訓(xùn)投入成本大

2.平臺(tái)運(yùn)營(yíng)管理

專業(yè)程度要求高:實(shí)時(shí)流內(nèi)容風(fēng)控難度大,自研投入成本高

風(fēng)險(xiǎn)應(yīng)急能力弱:突發(fā)違規(guī)處理能力弱,危機(jī)應(yīng)對(duì)經(jīng)驗(yàn)不足

審核效果需求嚴(yán):兼顧風(fēng)控與體驗(yàn),高實(shí)時(shí)與高產(chǎn)能難兩全

語(yǔ)音審核除了要識(shí)別音頻包含的文本內(nèi)容是否涉及敏感信息,同時(shí)還存在語(yǔ)音語(yǔ)調(diào)上的擬聲詞、感嘆詞和語(yǔ)氣詞的審核難度,例如涉及色情信息的嬌喘、呻吟等。這為語(yǔ)音審核提出了更高的挑戰(zhàn)。目前普遍采用的人工審核方式雖然能夠提供較好的審核能力,但需要對(duì)音頻文件進(jìn)行整段察驗(yàn),對(duì)音頻流進(jìn)行實(shí)時(shí)監(jiān)控,造成了較高的時(shí)間成本和人力投入。

數(shù)美實(shí)時(shí)語(yǔ)音社交平臺(tái)內(nèi)容風(fēng)控專項(xiàng)解決方案

對(duì)此,數(shù)美科技經(jīng)過(guò)多年在內(nèi)容風(fēng)控領(lǐng)域的深厚積累和持續(xù)自我升級(jí),開(kāi)發(fā)了基于深度學(xué)習(xí)與畫像的全棧式智能音頻風(fēng)控解決方案,能夠精準(zhǔn)識(shí)別色情、違禁等內(nèi)容風(fēng)險(xiǎn)與垃圾廣告信息,實(shí)現(xiàn)高效、準(zhǔn)確、全面覆蓋的內(nèi)容審核過(guò)濾,幫助平臺(tái)防御音頻內(nèi)容風(fēng)險(xiǎn)。

向“音”而生 數(shù)美科技護(hù)航實(shí)時(shí)語(yǔ)音社交平臺(tái)發(fā)展

方案架構(gòu)

在語(yǔ)音內(nèi)容獲取上,數(shù)美科技的智能音頻過(guò)濾技術(shù)支持OGG、MP3、ASF、WMA、WAV、MP3PRO、RM、REAL、APE、MODULE、MIDI、VQF等多種音頻格式和音頻流,能夠應(yīng)對(duì)不同語(yǔ)音內(nèi)容提供平臺(tái)使用的常用音頻格式,同時(shí)支持語(yǔ)音直播實(shí)時(shí)監(jiān)控、語(yǔ)音點(diǎn)播、語(yǔ)音消息和各種音頻文件的檢測(cè)。

除此之外,智能音頻識(shí)別還整合了業(yè)界一流的語(yǔ)音識(shí)別技術(shù)、大規(guī)模GPU計(jì)算的深度學(xué)習(xí)、基于敏感詞庫(kù)的名單服務(wù)、特殊聲音識(shí)別模型、基于深度學(xué)習(xí)的NLP模型以及實(shí)時(shí)分布式規(guī)則引擎等。其中深度學(xué)習(xí)模型能夠讓系統(tǒng)從多個(gè)維度檢測(cè)語(yǔ)義環(huán)境,準(zhǔn)確識(shí)別說(shuō)話意圖。而智能音頻識(shí)別技術(shù)根據(jù)不同場(chǎng)景和行業(yè)采用了專門化的判斷策略,結(jié)合強(qiáng)大的標(biāo)簽體系能夠?yàn)椴煌愋蜕缃黄脚_(tái)提供定制化的過(guò)濾服務(wù)。

向“音”而生 數(shù)美科技護(hù)航實(shí)時(shí)語(yǔ)音社交平臺(tái)發(fā)展

音頻內(nèi)容識(shí)別組成

在獲取到待檢測(cè)的音頻文件和音頻流后,主要從四個(gè)方面進(jìn)行內(nèi)容的檢測(cè)識(shí)別:

1.違禁違規(guī)

利用語(yǔ)音轉(zhuǎn)文本技術(shù)將語(yǔ)音信息轉(zhuǎn)為文本信息,再通過(guò)成熟的文本內(nèi)容檢測(cè),對(duì)音頻中出現(xiàn)的多種類型違規(guī)內(nèi)容進(jìn)行檢測(cè)。

2.涉黃違規(guī)

利用大規(guī)模GPU集群的計(jì)算能力和深度學(xué)習(xí)技術(shù),準(zhǔn)確快速穩(wěn)定地識(shí)別音頻中出現(xiàn)的色情,低俗或性感部分,在管理后臺(tái)對(duì)其進(jìn)行標(biāo)注和反饋,從而大規(guī)模提升人工審核團(tuán)隊(duì)效率,增強(qiáng)用戶瀏覽體驗(yàn)。

3.特殊聲音識(shí)別

同樣利用大規(guī)模GPU集群的強(qiáng)大計(jì)算能力和深度機(jī)器學(xué)習(xí)的技術(shù),除了一般的涉黃違規(guī)語(yǔ)言內(nèi)容,還能準(zhǔn)確識(shí)別出嬌喘、呻吟等非文本類的特殊聲音。

  4.導(dǎo)流廣告

通過(guò)語(yǔ)音轉(zhuǎn)文本技術(shù)將語(yǔ)音信息轉(zhuǎn)為文本信息,對(duì)文本內(nèi)容進(jìn)行關(guān)鍵詞檢測(cè),識(shí)別出潛在的添加微信號(hào)、QQ號(hào)、QQ群以及虛假信息等導(dǎo)流廣告音頻內(nèi)容。

智能音頻過(guò)濾技術(shù)對(duì)問(wèn)題音頻判斷的正確率以及反饋的正確率均高于90%。保證高正確率的同時(shí), 還提供了高處理效率,智能音頻過(guò)濾API的最快響應(yīng)時(shí)間不超過(guò)1s,超時(shí)率低于0.01%,而智能音頻過(guò)濾API也具有深厚的處理容量,默認(rèn)支持并發(fā)100路處理任務(wù),還可根據(jù)需求動(dòng)態(tài)擴(kuò)容。

同時(shí),數(shù)美即時(shí)語(yǔ)音社交平臺(tái)內(nèi)容風(fēng)控專項(xiàng)解決方案也具備以下四大特點(diǎn):

極速先行:毫秒級(jí)系統(tǒng)回調(diào)響應(yīng),7*24小時(shí)全天候服務(wù)。

強(qiáng)勢(shì)驅(qū)動(dòng):采用高性能應(yīng)用計(jì)算、全棧式實(shí)時(shí)智能風(fēng)控引擎。

  安全可靠:榮獲ISO20000、ISO27001 認(rèn)證,遵循GDPR管理?xiàng)l例。

智能多元:覆蓋多元化業(yè)務(wù)場(chǎng)景、支持多語(yǔ)言自動(dòng)識(shí)別。

行業(yè)實(shí)踐

向“音”而生 數(shù)美科技護(hù)航實(shí)時(shí)語(yǔ)音社交平臺(tái)發(fā)展

目前數(shù)美的音頻風(fēng)控解決方案已服務(wù)多個(gè)企業(yè),例如某語(yǔ)音社交APP每天產(chǎn)生上千萬(wàn)條的海量語(yǔ)音消息(包括群聊和私聊),這些語(yǔ)音消息都可能存在違規(guī)和廣告導(dǎo)流等風(fēng)險(xiǎn)信息,全量審查語(yǔ)音消息的人工成本高、實(shí)時(shí)性差。采用數(shù)美智能語(yǔ)音識(shí)別服務(wù)后,需要審核的數(shù)據(jù)時(shí)長(zhǎng)從每天860小時(shí)驟降到20小時(shí),極大降低人工審核成本,識(shí)別準(zhǔn)確率高達(dá)95%以上。

關(guān)于數(shù)美

數(shù)美科技(北京數(shù)美時(shí)代科技有限公司)成立于2015年6月,總部位于北京,并在杭州、上海、深圳、成都設(shè)有研發(fā)中心和分支機(jī)構(gòu), 團(tuán)隊(duì)核心成員均來(lái)自百度、阿里、騰訊、360、小米等知名互聯(lián)網(wǎng)企業(yè),擁有10余年搜索、安全、語(yǔ)音等互聯(lián)網(wǎng)在線產(chǎn)品研發(fā)經(jīng)驗(yàn)。目前,公司已累計(jì)完成四輪融資,累計(jì)金額超1億美金。

數(shù)美科技是專業(yè)的在線業(yè)務(wù)風(fēng)控解決方案提供商,致力于用AI技術(shù)解決在線業(yè)務(wù)中廣泛存在風(fēng)險(xiǎn)挑戰(zhàn),為全球互聯(lián)網(wǎng)、互聯(lián)網(wǎng)+以及產(chǎn)業(yè)互聯(lián)網(wǎng)客戶提供全棧式、可信賴的在線業(yè)務(wù)風(fēng)控解決方案,現(xiàn)已服務(wù)工商銀行、銀聯(lián)、春秋航空、小紅書、愛(ài)奇藝、猿輔導(dǎo)等上千家客戶,覆蓋金融、航旅、游戲、新零售、地產(chǎn)、電商、視頻、媒體、出行、教育等十多個(gè)行業(yè)。

數(shù)美科技結(jié)合多年黑產(chǎn)對(duì)抗經(jīng)驗(yàn)打造的全棧式智能風(fēng)控產(chǎn)品-天網(wǎng),旨在為客戶解決營(yíng)銷欺詐、支付風(fēng)控、數(shù)據(jù)盜爬、欺詐廣告等風(fēng)險(xiǎn)問(wèn)題,降本增效;同時(shí),結(jié)合人工智能技術(shù)打造全棧式智能內(nèi)容識(shí)別產(chǎn)品-天凈,為客戶提供一站式的內(nèi)容風(fēng)控方案,幫助客戶識(shí)別文本、圖片、音頻、視頻、網(wǎng)頁(yè)中出現(xiàn)的涉政、違禁、暴恐、色情、導(dǎo)流廣告等內(nèi)容,規(guī)避內(nèi)容風(fēng)險(xiǎn),提升運(yùn)營(yíng)效率。

目前,數(shù)美科技已經(jīng)構(gòu)建了全場(chǎng)景、全流程、全維度業(yè)務(wù)風(fēng)控產(chǎn)品矩陣,實(shí)現(xiàn)了SaaS AI風(fēng)控網(wǎng)絡(luò)的全球化部署,服務(wù)覆蓋中國(guó)、東南亞、北美、歐洲、中東,累計(jì)攔截風(fēng)險(xiǎn)行為600多億次,累計(jì)保護(hù)全球30多億用戶,為全球企業(yè)的線上業(yè)務(wù)發(fā)展保駕護(hù)航。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )