阿里達摩院獲中國法律智能技術(shù)評測兩項冠軍,參賽模型底座已在魔搭社區(qū)開放

2月3日消息,由最高人民法院司改辦和中國中文信息學(xué)會指導(dǎo)的中國法律智能技術(shù)評測(CAIL 2022)于日前公布比賽結(jié)果,阿里巴巴達摩院在八項任務(wù)中獲得兩個冠軍,是唯一獲得多項第一的參賽團隊。據(jù)介紹,此次參賽使用的預(yù)訓(xùn)練大模型底座通義AliceMind-structBERT已在魔搭社區(qū)開放(https://www.modelscope.cn/models/damo/nlp_structbert_backbone_base_law/summary),該模型是法律AI領(lǐng)域首個億級數(shù)據(jù)規(guī)模的大模型。

近年來,用AI輔助司法工作者提升案件處理的效率和公正性,逐漸成為法律領(lǐng)域的趨勢。作為國內(nèi)最權(quán)威的法律AI競賽,CAIL已連續(xù)舉辦5屆比賽。 據(jù)介紹,CAIL 2022設(shè)置了司法考試、事件檢測、文書校對、類案檢索、涉法輿情摘要、論辯理解、信息抽取、可解釋類案匹配八項任務(wù),共吸引2053支高校、企業(yè)和組織隊伍參賽。最終,達摩院在眾多參賽隊伍中脫穎而出,獲得文書校對和可解釋類案匹配兩項任務(wù)的最高分。

文書校對任務(wù)成績榜單.jpg

文書校對任務(wù)成績榜單

文書校對主要用于輔助司法人員檢出并糾正法律文書中存在的錯誤,例如錯別字、冗余、缺失、亂序等類型錯誤。此次比賽,達摩院采用了序列到編輯和序列到序列兩種主流的模型結(jié)構(gòu),并且采用編輯級別投票的方式對二者進行集成,其可以嘗試將錯誤的句子翻譯成正確的句子,同時對錯誤位置進行插入、修改、刪除等編輯動作。此外,為解決訓(xùn)練數(shù)據(jù)不足的問題,達摩院還采用數(shù)據(jù)增強的方法生成了大量的訓(xùn)練語料,有效提升模型的糾錯能力,最終該模型以81.759分的成績獲得第一。

可解釋類案匹配任務(wù)成績榜單.jpg

可解釋類案匹配任務(wù)成績榜單

可解釋類案匹配可以為待決案件的裁判提供參考和依據(jù)。參賽隊伍需要針對系統(tǒng)給定的兩個案件信息,來判斷兩個案件是“匹配”、“部分匹配”還是“不匹配”關(guān)系。達摩院基于法律特征句,構(gòu)建了句-段-案件的類案匹配體系,最終判斷出案件匹配程度,而其中的句子和段落則可成為類案匹配的依據(jù),從而達到模型的可解釋性。并且對案件匹配任務(wù)進行了細粒度的拆解,針對不同匹配性質(zhì)選用不同文本輸入,有效提升模型匹配的魯棒性。最終總成績?yōu)?.801,位列第一位。

目前,達摩院在法律AI領(lǐng)域已發(fā)表數(shù)十篇國際頂會論文,團隊輔助研發(fā)的AI法官助理“小智”已在浙江省高院、黑龍江高院等法院上線應(yīng)用,可將簡單案件庭審效率提升50%以上,已輔助審理案件超10000件。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2023-02-03
阿里達摩院獲中國法律智能技術(shù)評測兩項冠軍,參賽模型底座已在魔搭社區(qū)開放
2月3日消息,由最高人民法院司改辦和中國中文信息學(xué)會指導(dǎo)的中國法律智能技術(shù)評測(CAIL 2022)于日前公布比賽結(jié)果,阿里巴巴達摩院在八項任務(wù)中獲得兩個冠軍,是唯一獲得多項第一的參賽團隊。

長按掃碼 閱讀全文