理光在國際ACL 2024 SMM4H賽事中奪得第一

近日,理光中國研究院(以下簡稱SRCB)在自然語言處理頂級會議Association of Computational Linguistics 2024(以下簡稱ACL)的官方比賽Social Media Mining for Health Research and Applications Workshop and Shared Tasks 2024(以下簡稱SMM4H)中獲得共享競賽任務提取和規(guī)范化英文推文中的藥物不良事件(ADEs)賽道的第一名,并受邀分享了技術方案。

全球聚焦,學界盛會

ACL是一個國際性學術組織,致力于推動計算語言學領域的研究、開發(fā)和應用。每年一度的ACL大會,以其前沿的研究議題、權威的學術報告和廣泛的行業(yè)參與,吸引著全球學者和專業(yè)人士的目光,被譽為自然語言處理領域的風向標。

SMM4H是一個專注于社交媒體數據挖掘在健康研究和應用中的年會和競賽活動。今年第九屆SMM4H的主題為 "Large Language Models (LLMs) and Generalizability for Social Media NLP",聚焦于探索大語言模型(LLMs)在社交媒體自然語言處理(NLP)任務中的應用及其泛化能力。在這個跨學科的平臺上,與會者共同探討如何有效運用最前沿的技術通過社交媒體數據洞察和解決現實世界中的健康問題。SMM4H不僅為參與者提供了一個展示研究成果、交流創(chuàng)新思想的舞臺,更為推動健康科學研究與實踐的進步貢獻了重要力量。

攻堅克難,再創(chuàng)佳績

SRCB在SMM4H 2024共享競賽任務中挑戰(zhàn)的課題是“提取和規(guī)范化英文推文中的藥物不良事件(ADEs)”,任務內容是從嘈雜的社交媒體推文中精確提取出由藥物引發(fā)的不良反應,并將其映射為MedDRA詞典中的標準化醫(yī)學術語。MedDRA詞典(全稱Medical Dictionary for Regulatory Activities)是一個國際權威的標準化醫(yī)學術語集,用于幫助不同國家和地區(qū)的藥品監(jiān)管機構、制藥公司、臨床研究人員以及醫(yī)療保健專業(yè)人員之間進行有效的溝通和數據交換。

image.png

*競賽任務描述

面對非結構化數據的復雜性、噪音和背景信息的干擾、多義性問題以及數據稀疏性等多重任務挑戰(zhàn),理光團隊通過以下技術有效地提高了不良事件信息提取和術語規(guī)范化的性能:

1.提出了一個包含ADEs抽取、MedDRA術語檢索和MedDRA術語過濾模塊的體系架構,有效地緩解了傳統方法使用的流程所帶來的誤差傳播,提升了術語規(guī)范化的準確性。

2.創(chuàng)新性地提出了四種基于大語言模型的數據增強方法,充分發(fā)揮了大語言模型生成高質量文本內容的能力。

3.通過使用醫(yī)學領域訓練樣本對文本嵌入模型進行微調,顯著提高了MedDRA術語的召回率。

理光團隊提出的體系架構,通過分析社交媒體上的用戶反饋,能夠補充臨床試驗中未報告的藥物副作用信息,為藥物安全性評估提供了新的視角。實時監(jiān)測公共健康趨勢以及分析社交媒體數據,能夠快速反映社會中某些藥物的使用情況和相關風險,為公共衛(wèi)生決策提供了有力的數據支持。對于制藥公司和監(jiān)管機構來說,這一系統提供了實時挖掘社交媒體上的ADEs信息的能力,有助于及早發(fā)現并應對潛在的公共健康問題。

image.png

*理光中國研究院NLP團隊成員在ACL2024現場分享技術方案

我們秉持前瞻視野,持續(xù)保持對創(chuàng)新領域的敏銳嗅覺,探索前沿AI科技,在自然語言處理領域不斷進取, 與上下游合作伙伴合作共創(chuàng),推動AI技術在社會各個領域的創(chuàng)新與落地。

我們將持續(xù)引領技術進步與應用拓展,攜手全球合作伙伴積極探索、不懈挑戰(zhàn),賦能更多行業(yè)邁向高效與可持續(xù)發(fā)展的未來。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )