阿里達(dá)摩院聯(lián)合高德發(fā)布多模態(tài)地理文本預(yù)訓(xùn)練模型MGeo,已在魔搭社區(qū)開放

2月21日,達(dá)摩院聯(lián)合高德發(fā)布業(yè)界首個(gè)多模態(tài)地理文本預(yù)訓(xùn)練模型MGeo,其可充分理解地圖上的每一個(gè)元素,并精準(zhǔn)完成地圖搜索、地理位置分析等任務(wù)。MGeo是阿里通義模型系列旗下的新模型,目前已在魔搭社區(qū)開放(https://modelscope.cn/models/damo/mgeo_backbone_chinese_base/summary)。

地理文本信息處理是導(dǎo)航軟件、物流以及零售等行業(yè)的基礎(chǔ)。然而,目前傳統(tǒng)地理文本AI算法對(duì)于地理信息的理解仍局限在經(jīng)緯度以及經(jīng)緯度的遠(yuǎn)近上,無(wú)法像人類一樣理解地圖上的元素,該方法難以精準(zhǔn)表示景區(qū)、園區(qū)、商業(yè)街等大型地理實(shí)體的具體形狀,以及不同地圖元素之間復(fù)雜的臨近、包含等關(guān)系。

針對(duì)上述問題,達(dá)摩院聯(lián)合高德提出地理文本多模態(tài)模型,使用對(duì)抗MLM預(yù)訓(xùn)練、句子對(duì)預(yù)訓(xùn)練及多模態(tài)預(yù)訓(xùn)練三大技術(shù),并用多任務(wù)預(yù)訓(xùn)練將這三種預(yù)訓(xùn)練任務(wù)進(jìn)行動(dòng)態(tài)組合,最終訓(xùn)練得到適合于多類地理文本任務(wù)的預(yù)訓(xùn)練底座MGeo。該模型擁有豐富的地理知識(shí),能像人類一樣跨模態(tài)理解地圖與地理文本的信息,相關(guān)研究成果已被EMNLP、AAAI等國(guó)際頂級(jí)會(huì)議收錄。

00.png

MGeo像人類一樣具備跨模態(tài)理解能力,可識(shí)別地圖元素之間的位置關(guān)系

據(jù)悉,高德基于MGeo研發(fā)了全新的模型,不僅顯著提高泛化語(yǔ)義的表示能力,還可準(zhǔn)確識(shí)別不同地圖元素之間的位置關(guān)系,有效提升用戶的搜索體驗(yàn)。例如,當(dāng)用戶在杭州輸入“星光薈對(duì)面中國(guó)美術(shù)”時(shí),MGeo能根據(jù)位置關(guān)系準(zhǔn)確定位到中國(guó)美術(shù)學(xué)院象山校區(qū),而傳統(tǒng)BERT模型則給出了錯(cuò)誤定位結(jié)果;此外,在用戶書寫有誤的情況下,該模型也能匹配正確的結(jié)果。該能力已逐步在高德灰度上線。

000.jpg

在四平市搜索“傭兵小區(qū)”,高德可準(zhǔn)確定位“擁軍社區(qū)”

達(dá)摩院語(yǔ)言技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人黃非表示:“地理信息與AI的融合已是業(yè)界公認(rèn)的趨勢(shì),但傳統(tǒng)AI比如文本處理在地理信息應(yīng)用場(chǎng)景中有一定局限性 ,我們需要讓AI學(xué)習(xí)人類對(duì)于空間信息的理解范式,例如,通過地圖中的地理實(shí)體以及他們之間的關(guān)系來(lái)判定地理文本中各個(gè)元素的歸屬以及指向?!?/p>

作為最早投入預(yù)訓(xùn)練語(yǔ)言模型研究的團(tuán)隊(duì)之一,達(dá)摩院研發(fā)了阿里通義AliceMind,該體系涵蓋預(yù)訓(xùn)練模型、多語(yǔ)言預(yù)訓(xùn)練模型、超大中文預(yù)訓(xùn)練模型等,具備閱讀理解、機(jī)器翻譯、對(duì)話問答、文檔處理等多種能力,該模型體系已斬獲36項(xiàng)國(guó)際賽事冠軍。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2023-02-21
阿里達(dá)摩院聯(lián)合高德發(fā)布多模態(tài)地理文本預(yù)訓(xùn)練模型MGeo,已在魔搭社區(qū)開放
2月21日,達(dá)摩院聯(lián)合高德發(fā)布業(yè)界首個(gè)多模態(tài)地理文本預(yù)訓(xùn)練模型MGeo,其可充分理解地圖上的每一個(gè)元素,并精準(zhǔn)完成地圖搜索、地理位置分析等任務(wù)。

長(zhǎng)按掃碼 閱讀全文