2022年3月16日,由中國(guó)人工智能學(xué)會(huì)多語(yǔ)種智能信息處理專委會(huì)(CAAI-IMLIP)主辦,傳神語(yǔ)聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司承辦的“人工智能在多語(yǔ)信息處理領(lǐng)域的創(chuàng)新探討研討會(huì)”,在武漢、北京兩地,以線上+線下結(jié)合的形式聯(lián)動(dòng)呈現(xiàn)。本次研討會(huì)匯聚多位多語(yǔ)信息處理領(lǐng)域的知名專家學(xué)者,共聚一堂,圍繞深度語(yǔ)義解析、多語(yǔ)言語(yǔ)音處理、推薦系統(tǒng)中的信息去噪、機(jī)器翻譯技術(shù)等,共探人工智能在多語(yǔ)種信息處理領(lǐng)域的創(chuàng)新和發(fā)展。
物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等新技術(shù)正當(dāng)其時(shí),技術(shù)的變革往往帶來文化的新形態(tài),由此也會(huì)對(duì)語(yǔ)言文字帶來廣泛而深刻的影響。同時(shí),伴隨“一帶一路”建設(shè)的深入推進(jìn),多語(yǔ)種信息處理領(lǐng)域急需進(jìn)一步整合語(yǔ)種資源、數(shù)據(jù)資源,利用云計(jì)算、人工智能、大數(shù)據(jù)等技術(shù)深入開展自然語(yǔ)言理解、智能語(yǔ)音交互、機(jī)器翻譯等技術(shù)的研究。
數(shù)字時(shí)代發(fā)展,多語(yǔ)信息領(lǐng)域呈全新趨勢(shì)
中國(guó)人工智能學(xué)會(huì)多語(yǔ)種智能信息處理專委會(huì)秘書長(zhǎng)張華平教授代表專委會(huì)在研討會(huì)上致辭,強(qiáng)調(diào)專委會(huì)成立的初衷,通過成立各個(gè)工作組、開展各項(xiàng)主題會(huì)議的形式,促進(jìn)多語(yǔ)種智能處理的發(fā)展,鏈接全球、鏈接產(chǎn)學(xué)研,實(shí)現(xiàn)語(yǔ)言相通、信息相通,為“一帶一路”上各國(guó)家各民族的經(jīng)貿(mào)相通、文化相通與民心相通貢獻(xiàn)力量。
傳神語(yǔ)聯(lián)此次承辦研討會(huì),也獲得了張華平秘書長(zhǎng)的高度贊揚(yáng)和支持,對(duì)此傳神語(yǔ)聯(lián)創(chuàng)始人兼董事長(zhǎng)何恩培在發(fā)言中提到,在信息大爆炸時(shí)代,面對(duì)不同語(yǔ)言背后的信息轉(zhuǎn)化需求,要從兩個(gè)維度用AI重塑翻譯作業(yè)流程和供應(yīng)鏈改造,從而達(dá)到機(jī)器的速度,人的質(zhì)量。而數(shù)字技術(shù)的介入,意味著新翻譯時(shí)代已然到來。
不同語(yǔ)言的轉(zhuǎn)化不只是簡(jiǎn)單的信息轉(zhuǎn)換,更多是不同文化的碰撞和呈現(xiàn)。翻譯需要賦予不同語(yǔ)言標(biāo)準(zhǔn)、正確、精美的含義。而語(yǔ)義分析作為處理自然語(yǔ)言時(shí)需要執(zhí)行的步驟之一,其核心目的就是將正確的意義分配給句子,讓整句話呈現(xiàn)精準(zhǔn)的含義。
貫穿語(yǔ)義和語(yǔ)音層面,探索創(chuàng)新可能
語(yǔ)義分析作為NLP核心技術(shù)中的一項(xiàng),一直以來都備受業(yè)內(nèi)人士關(guān)注。北京語(yǔ)言大學(xué)信息學(xué)院院長(zhǎng)荀恩東教授在演講中提到,“語(yǔ)義分析的本質(zhì)是生成語(yǔ)義概念結(jié)構(gòu)。通過采用組合策略實(shí)現(xiàn)深度語(yǔ)義分析,消解在語(yǔ)義分析過程中遇到的多樣性以及歧義性等問題,從而提升系統(tǒng)的可解釋性。”
人類通過語(yǔ)言鏈接自身和外部世界,語(yǔ)言作為溝通和認(rèn)知的工具,輔助人類不斷探索未知??萍嫉倪M(jìn)步讓語(yǔ)言有了更多樣、更智能化的呈現(xiàn)模式。在這其中語(yǔ)義分析技術(shù)相當(dāng)于人類大腦,負(fù)責(zé)思考和信息處理,而語(yǔ)音技術(shù)則相當(dāng)于人的嘴巴和耳朵,負(fù)責(zé)表達(dá)和獲取。
圍繞解決低資源語(yǔ)言語(yǔ)音處理問題,新加坡科技研究局董明會(huì)博士以語(yǔ)音識(shí)別和語(yǔ)音翻譯為例,講解了利用已有的大語(yǔ)種語(yǔ)言數(shù)據(jù)的多語(yǔ)言處理技術(shù)、通過使用無(wú)監(jiān)督學(xué)習(xí)的方法、預(yù)訓(xùn)練模型和遷移學(xué)習(xí)的新思路。
技術(shù)賦能創(chuàng)新,信息獲取和轉(zhuǎn)化方式更便捷
數(shù)字技術(shù)的不斷發(fā)展,為互聯(lián)網(wǎng)經(jīng)濟(jì)發(fā)展賦予了全新思路。來自武漢大學(xué)國(guó)家網(wǎng)絡(luò)安全學(xué)院的李晨亮教授,從序列推薦、購(gòu)物籃推、新聞推薦以及短視頻推薦四個(gè)任務(wù),講述了利用信息去噪改善推薦性能的幾項(xiàng)嘗試。
隨著全球化網(wǎng)絡(luò)時(shí)代的到來,人們依托數(shù)據(jù)推薦獲取更精準(zhǔn)的信息,在接受多樣化信息的同時(shí),也面臨著語(yǔ)言障礙問題。實(shí)現(xiàn)任意時(shí)間、任意地點(diǎn)、任意語(yǔ)言的無(wú)障礙自由溝通是人類追求的一個(gè)夢(mèng)想。也是全球化、數(shù)字化背景下的一個(gè)行業(yè)縮影。因此技術(shù)的融入,賦予了人們快速跨越語(yǔ)言障礙的方式方法,更便捷更高效的滿足信息轉(zhuǎn)化的需求。
伴隨AI技術(shù)在翻譯行業(yè)逐步深入的應(yīng)用,如何在確保機(jī)器翻譯優(yōu)勢(shì)的前提下,滿足商用交付質(zhì)量成當(dāng)下亟待解決的問題。傳神語(yǔ)聯(lián)網(wǎng)研究院執(zhí)行院長(zhǎng)何征宇在演講中,表明語(yǔ)聯(lián)網(wǎng)自主開發(fā)構(gòu)建IOLAIDrive語(yǔ)聯(lián)網(wǎng)人工智能底層支撐系統(tǒng),并在產(chǎn)能智能化組織調(diào)度、機(jī)器翻譯以及人機(jī)共譯等三大關(guān)鍵核心NLP技術(shù)領(lǐng)域取得突破進(jìn)展。語(yǔ)聯(lián)網(wǎng)提出新的交付標(biāo)準(zhǔn)“HWD”,即交付速度的計(jì)量記錄刷新: 十萬(wàn)字以小時(shí)(HOUR)計(jì),百萬(wàn)字以天(DAY)計(jì),千萬(wàn)字以周(WEEK)計(jì),將來還可能進(jìn)一步提升。
會(huì)議最后,傳神語(yǔ)聯(lián)創(chuàng)始人兼董事長(zhǎng)何恩培表示,“信息大爆炸時(shí)代讀取信息的對(duì)象,已經(jīng)從單純的人類,變?yōu)榱巳伺c機(jī)器同時(shí)閱讀和處理。因此多語(yǔ)信息的處理,不僅要做好效能提升,更要在此基礎(chǔ)上進(jìn)行創(chuàng)新突破,打破人力處理能力的瓶頸和界限,銜接好人與機(jī)器,這是身處多語(yǔ)信息處理領(lǐng)域所有企業(yè)的共同使命。”
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )