天翼云AI團(tuán)隊(duì)奪得ZeroCLUE榜單桂冠

最近ChatGPT火了!寫代碼、寫情書、寫文章、做題……它啥都會(huì)。在ChatGPT強(qiáng)大的功能背后,離不開業(yè)內(nèi)不斷精進(jìn)的人工智能技術(shù)的支撐。零樣本學(xué)習(xí)就是ChatGPT的核心技術(shù)之一。

近日,天翼云智能邊緣事業(yè)部AI團(tuán)隊(duì)在中文語言理解零樣本學(xué)習(xí)權(quán)威榜單ZeroCLUE中拔得頭籌,這標(biāo)志著天翼云AI在認(rèn)知智能領(lǐng)域處于行業(yè)領(lǐng)先地位。

天翼云智能邊緣事業(yè)部AI團(tuán)隊(duì)部分成員合影

ZeroCLUE是中文語言理解零樣本學(xué)習(xí)的權(quán)威榜單,在學(xué)術(shù)和工業(yè)界有著廣泛影響力,吸引了IDEA研究院、OpenBMB等眾多高水平科研單位和企業(yè)競(jìng)相角逐。天翼云AI團(tuán)隊(duì)以76.217的總分奪得榜單桂冠,成績(jī)大幅領(lǐng)先第二名。同時(shí),天翼云AI團(tuán)隊(duì)在榜單“BUSTM任務(wù)”中占據(jù)榜首,成為該任務(wù)中唯一突破90分的團(tuán)隊(duì)。

ZeroCLUE榜單(2023.02.15),其中Human表示人類測(cè)評(píng)成績(jī)

零樣本學(xué)習(xí)(Zero-Shot Learning)是自然語言處理技術(shù)中重要的研究方向,旨在突破全監(jiān)督學(xué)習(xí)范式,讓AI算法在數(shù)據(jù)稀缺、標(biāo)注困難的場(chǎng)景中更好地發(fā)揮作用。

ZeroCLUE榜單包含EPRSTMT(電商評(píng)論情感分析)、CSLDCP(科學(xué)文獻(xiàn)學(xué)科分類)、TNEWSF(新聞分類)、IFLYTEKF(應(yīng)用描述主題分類)、OCNLIF(自然語言推理)、BUSTM(對(duì)話短文本匹配)、CHIDF(成語閱讀理解)、CSLF(摘要判斷關(guān)鍵詞判別)、CLUEWSCF(代詞消歧)9大任務(wù),涵蓋了當(dāng)今自然語言處理技術(shù)的主流研究方向。參賽者的排名則由上述9個(gè)任務(wù)的平均得分決定。下圖展示了上述任務(wù)的具體數(shù)據(jù)細(xì)節(jié)。

本次打榜競(jìng)賽中,天翼云AI團(tuán)隊(duì)的算法核心之一是采用了“統(tǒng)一多項(xiàng)選擇”(Unified Multiple Choice)的思想,將不同范式的自然語言處理任務(wù)統(tǒng)一轉(zhuǎn)化為多項(xiàng)選擇任務(wù),使得在訓(xùn)練和微調(diào)階段,每個(gè)任務(wù)都能從其它數(shù)據(jù)與任務(wù)中獲益。

image.png

基于以上思想對(duì)每個(gè)任務(wù)進(jìn)行范式的設(shè)計(jì)和統(tǒng)一,并結(jié)合開源模型進(jìn)行算法優(yōu)化和測(cè)試,最終不僅能夠增強(qiáng)模型在本任務(wù)中的性能,也提升了其處理不同任務(wù)的泛化能力。

本次天翼云AI團(tuán)隊(duì)在競(jìng)爭(zhēng)激烈的ZeroCLUE打榜中脫穎而出,源于其在認(rèn)知智能領(lǐng)域的技術(shù)沉淀,以及對(duì)業(yè)務(wù)場(chǎng)景的深度理解和應(yīng)用。

值得一提的是,天翼云的零樣本學(xué)習(xí)技術(shù)在實(shí)際業(yè)務(wù)中已獲得了廣泛應(yīng)用。例如,在知識(shí)平臺(tái)中使用零樣本學(xué)習(xí)技術(shù)對(duì)大量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行知識(shí)挖掘和管理;在缺乏樣本的場(chǎng)景中使用零樣本學(xué)習(xí)技術(shù)提升底層算法的知識(shí)抽取能力,進(jìn)而提高平臺(tái)上層智能搜索、推薦、問答等業(yè)務(wù)性能。

未來,天翼云將繼續(xù)推進(jìn)人工智能技術(shù)的創(chuàng)新突破,加快打造原創(chuàng)技術(shù)策源地,以更多的數(shù)字技術(shù)應(yīng)用,賦能千行百業(yè)數(shù)字化轉(zhuǎn)型。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )