為了克制AI幻覺(jué),硅谷迷上了檢索增強生成技術(shù)

極客網(wǎng)·人工智能6月18日 現在的生成式AI工具還不完美,經(jīng)常會(huì )“撒謊”,這就是所謂的幻覺(jué)。為了克制幻覺(jué),開(kāi)發(fā)者開(kāi)發(fā)出一系列工具,最近在硅谷比較流行的工具是檢索增強生成(Retrieval-augmented Generation,簡(jiǎn)稱(chēng)RAG)。

RAG是一種結合檢索和生成技術(shù)的模型,它為大模型提供外部知識源,使得大模型具備從指定的知識庫中進(jìn)行檢索,并結合上下文信息,生成相對高質(zhì)量的回復內容,減少模型幻覺(jué)問(wèn)題。例如,企業(yè)可以將所有的HR政策和福利信息上傳到RAG數據庫,AI聊天機器人聚焦于可以從這些文件中找到的答案。

聽(tīng)起來(lái)RAG似乎和ChatGPT技術(shù)沒(méi)有什么太大差異,實(shí)際上差異蠻大的。Thomson Reuters用RAG技術(shù)開(kāi)發(fā)出一套面向法務(wù)工作者的AI工具,其公司高管Pablo Arredondo說(shuō):“RAG不會(huì )單純依靠初始訓練生成的記憶來(lái)回答問(wèn)題,它會(huì )利用搜索引擎收集真實(shí)文檔,比如判例法、論文等,然后根據這些文檔錨定模型的響應?!?/p>

例如,我們可以將某本雜志的所有內容上傳到數據庫,根據數據庫內容回答問(wèn)題。因為AI工具關(guān)注的信息面比較窄,信息質(zhì)量更高,基于RAG開(kāi)發(fā)的聊天機器人在回答問(wèn)題時(shí)會(huì )比通用機器人更有深度。

RAG機器人會(huì )不會(huì )犯錯呢?當然會(huì ),但它捏造內容的概率會(huì )降低。

研究人員認為,RAG方法有很大優(yōu)勢,在訓練模型時(shí),它所接受的信息都是事實(shí),而且是可以追溯來(lái)源的事實(shí)。如果你能教模型對提供的數據進(jìn)行分類(lèi),并在每個(gè)輸出結果中使用、引用,那么人工智能工具就不太可能犯嚴重的錯誤。

用了RAG技術(shù),幻覺(jué)能降低多少呢?一些研究者認為,幻覺(jué)可以達到很低的程度,但無(wú)法完全消除。換言之,RAG不是萬(wàn)能藥??傮w看,幻覺(jué)減少程度取決于兩個(gè)核心要素:一是整體RAG的部署質(zhì)量,二是對AI幻覺(jué)的定義。

并非所有的RAG都是一樣的。在自定義數據庫中,內容的精度影響著(zhù)結果質(zhì)量,但它并不是唯一影響因素。除了要關(guān)注內容的質(zhì)量,還要關(guān)注搜索質(zhì)量及基于問(wèn)題的正確內容的檢索。掌握過(guò)程中的每一步都至關(guān)重要,因為一個(gè)失誤就可能使模型完全偏離。

斯坦福教授Daniel Ho說(shuō):“凡是在某個(gè)搜索引擎中使用自然語(yǔ)言搜索的律師都會(huì )發(fā)現,許多時(shí)候語(yǔ)義相似度影響巨大,它會(huì )導出完全不相關(guān)的資料?!?/p>

如何定義RAG應用中出現的幻覺(jué)也很重要。一些專(zhuān)家認為,判斷RAG系統是否出現幻覺(jué)主要是看輸出結果是否與數據檢索時(shí)模型找到的答案一致。斯坦福大學(xué)則認為,要檢查結果,看它是否基于提供的數據,是否符合事實(shí)。

在回答法律問(wèn)題時(shí),RAG系統明顯比ChatGPT、Gemini更好,但它仍然有可能忽視細節,隨機給出錯誤答案。幾乎所有專(zhuān)家都認為,即使有了RAG系統,也需要人類(lèi)參與,對引用信息進(jìn)行雙重檢查,判定結果的準確率。

在法律領(lǐng)域RAG系統可以找到用武之地,在其它領(lǐng)域也一樣。凡是需要專(zhuān)業(yè)知識的專(zhuān)業(yè)領(lǐng)域,AI系統給出的答案都應該錨定真實(shí)文件,所以RAG適合專(zhuān)業(yè)領(lǐng)域。

Daniel Ho說(shuō):“幻覺(jué)一直存在,我們還沒(méi)有找到好辦法真正消除幻覺(jué)?!彪m然RAG可以降低錯誤率,但還是需要人類(lèi)來(lái)判斷結果如何。(小刀)

(免責聲明:本網(wǎng)站內容主要來(lái)自原創(chuàng )、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個(gè)人認為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實(shí)內容時(shí),應及時(shí)向本網(wǎng)站提出書(shū)面權利通知或不實(shí)情況說(shuō)明,并提供身份證明、權屬證明及詳細侵權或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì )依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2024-06-18
為了克制AI幻覺(jué),硅谷迷上了檢索增強生成技術(shù)
RAG機器人會(huì )不會(huì )犯錯呢?當然會(huì ),但它捏造內容的概率會(huì )降低。

長(cháng)按掃碼 閱讀全文