2月3日消息,由最高人民法院司改辦和中國中文信息學會指導的中國法律智能技術評測(CAIL 2022)于日前公布比賽結果,阿里巴巴達摩院在八項任務中獲得兩個冠軍,是唯一獲得多項第一的參賽團隊。據介紹,此次參賽使用的預訓練大模型底座通義AliceMind-structBERT已在魔搭社區(qū)開放(https://www.modelscope.cn/models/damo/nlp_structbert_backbone_base_law/summary),該模型是法律AI領域首個億級數據規(guī)模的大模型。
近年來,用AI輔助司法工作者提升案件處理的效率和公正性,逐漸成為法律領域的趨勢。作為國內最權威的法律AI競賽,CAIL已連續(xù)舉辦5屆比賽。 據介紹,CAIL 2022設置了司法考試、事件檢測、文書校對、類案檢索、涉法輿情摘要、論辯理解、信息抽取、可解釋類案匹配八項任務,共吸引2053支高校、企業(yè)和組織隊伍參賽。最終,達摩院在眾多參賽隊伍中脫穎而出,獲得文書校對和可解釋類案匹配兩項任務的最高分。
文書校對任務成績榜單
文書校對主要用于輔助司法人員檢出并糾正法律文書中存在的錯誤,例如錯別字、冗余、缺失、亂序等類型錯誤。此次比賽,達摩院采用了序列到編輯和序列到序列兩種主流的模型結構,并且采用編輯級別投票的方式對二者進行集成,其可以嘗試將錯誤的句子翻譯成正確的句子,同時對錯誤位置進行插入、修改、刪除等編輯動作。此外,為解決訓練數據不足的問題,達摩院還采用數據增強的方法生成了大量的訓練語料,有效提升模型的糾錯能力,最終該模型以81.759分的成績獲得第一。
可解釋類案匹配任務成績榜單
可解釋類案匹配可以為待決案件的裁判提供參考和依據。參賽隊伍需要針對系統(tǒng)給定的兩個案件信息,來判斷兩個案件是“匹配”、“部分匹配”還是“不匹配”關系。達摩院基于法律特征句,構建了句-段-案件的類案匹配體系,最終判斷出案件匹配程度,而其中的句子和段落則可成為類案匹配的依據,從而達到模型的可解釋性。并且對案件匹配任務進行了細粒度的拆解,針對不同匹配性質選用不同文本輸入,有效提升模型匹配的魯棒性。最終總成績?yōu)?.801,位列第一位。
目前,達摩院在法律AI領域已發(fā)表數十篇國際頂會論文,團隊輔助研發(fā)的AI法官助理“小智”已在浙江省高院、黑龍江高院等法院上線應用,可將簡單案件庭審效率提升50%以上,已輔助審理案件超10000件。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )