AIGC日日生新,商湯發(fā)布SenseTrust治理平臺,護航生成式AI可信發(fā)展

(2023年7月17日,上海)生成式AI火爆全球,國內(nèi)外AI大模型日新月異,人工智能加速走進日常生活。如何在技術(shù)“狂飆”的同時,引導技術(shù)應用的正向發(fā)展?在本年度世界人工智能大會上,商湯科技就此問題給出了答案:著眼現(xiàn)實問題,用可信AI基礎(chǔ)設施“護航”大模型發(fā)展。

繼4月發(fā)布自研大模型體系后,商湯迅速升級迭代,重磅推出全面升級的“商湯日日新SenseNova”。與之一起亮相的,還有商湯可信AI基礎(chǔ)設施—SenseTrust。SenseTrust包含一套完整覆蓋數(shù)據(jù)、模型、應用治理環(huán)節(jié)的可信AI治理工具,可為商湯自身及行業(yè)提供倫理、安全二維一體的檢測與加固解決方案,推動發(fā)展安全可信的人工智能產(chǎn)業(yè)生態(tài)。

活動上,商湯副總裁、AI倫理與治理委員會主席張望表示:“技術(shù)規(guī)?;涞赜袃牲c關(guān)鍵條件,一是成本低、應用廣的普惠性,二是要可靠、可信的安全性。以大算力為基礎(chǔ)的大模型及通用人工智能為加速了條件一的滿足,同時也帶來了技術(shù)濫用風險的規(guī)?;墶H绾伪U?a href="http://ygpos.cn/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD_1.html" target="_blank" class="keylink">人工智能系統(tǒng)的安全可信已經(jīng)成為業(yè)界乃至全社會面臨的一項緊迫課題。為此,商湯針對新時期人工智能的風險特點,打造覆蓋數(shù)據(jù)處理、模型開發(fā)、應用部署等AI系統(tǒng)全生命周期的可信AI基礎(chǔ)設施SenseTrust,以助力打造可信的大模型。”

活動期間,商湯也正式發(fā)布了人工智能倫理與治理的年度報告——《商湯大模型倫理原則與實踐白皮書》。白皮書由商湯智能產(chǎn)業(yè)研究院與上海交通大學計算法學與AI倫理研究中心共同編制。白皮書以大模型的發(fā)展為背景,以生成式人工智能的治理為主題,以“商湯日日新SenseNova”大模型體系治理實踐為案例,提出了生成式人工智能治理的核心原則和“三維對齊”科技倫理模式,系統(tǒng)呈現(xiàn)了雙方在AI治理領(lǐng)域的最新觀點。

范式變化引發(fā)新挑戰(zhàn) 業(yè)界亟需新時代下技術(shù)治理手段

大模型時代,“基礎(chǔ)模型+微調(diào)”為主要特征的生產(chǎn)范式大大降低了開發(fā)成本和應用門檻。AI應用場景更加開放、數(shù)據(jù)模態(tài)更加多元、應用領(lǐng)域更加廣泛;與之對應的,技術(shù)濫用、風險來源指數(shù)級增長,風險評估標準更加難以界定,潛在影響規(guī)?;瘮U散。在應用層面,諸如“幻覺”現(xiàn)象、數(shù)據(jù)投毒、混淆攻擊、誘導攻擊等具有現(xiàn)實意義的風險挑戰(zhàn)陸續(xù)顯現(xiàn)。無論是未來生命研究所發(fā)布的公開信,還是國內(nèi)外一系列監(jiān)管政策的推出,都反映出全球各方對人工智能風險挑戰(zhàn)的高度關(guān)注。

大模型時代:生產(chǎn)范式變革引發(fā)AI風險范式轉(zhuǎn)變

商湯“SenseTrust”構(gòu)筑大模型時代的“壓艙石”

作為行業(yè)領(lǐng)先的人工智能企業(yè),商湯科技一直以來高度重視人工智能倫理與治理工作,將技術(shù)創(chuàng)新與技術(shù)治理并重。早在2019年商湯就同步啟動了兩項前瞻性工作,一項是大模型研發(fā),另一項就是AI倫理與治理。此前,商湯已形成較為完善的人工智能倫理與治理組織結(jié)構(gòu)、管理制度、審查機制、工具體系、倫理文化建設體系和外部生態(tài)網(wǎng)絡,并收獲行業(yè)廣泛認可。

新時代下,技術(shù)加速創(chuàng)新、應用日新月異,傳統(tǒng)運營式的治理手段需相應升級,以適應飛速發(fā)展、無限拓展的治理需求。商湯整合長期倫理治理思考及技術(shù)能力,針對當下生成式人工智能的風險特點,打造可信AI基礎(chǔ)設施——SenseTrust,包含數(shù)據(jù)治理、模型治理、應用治理等層面技術(shù)工具,可提供數(shù)據(jù)處理、模型訓練、模型部署、推理服務等全方位、全鏈路的可信AI檢測與加固“工具箱”,為大模型時代構(gòu)筑“壓艙石”。

“SenseTrust”——商湯可信 AI 基礎(chǔ)設施應用圖景

· 在數(shù)據(jù)層面,“SenseTrust” 能夠提供從數(shù)據(jù)脫敏、數(shù)據(jù)去毒、數(shù)據(jù)合規(guī)審查及偏見評估等治理工具。例如,在模型訓練數(shù)據(jù)的預處理環(huán)節(jié),“SenseTrust”提供的數(shù)據(jù)去毒工具能夠檢測數(shù)據(jù)來源中是否包含帶有后門、擾亂的有毒數(shù)據(jù),并提供去毒方案。針對顯式、隱式等不同形式的“毒素”檢測率大于95%,結(jié)合數(shù)據(jù)清洗與對抗防御等方法,能夠?qū)崿F(xiàn)有效去毒。目前,“SenseTrust”數(shù)據(jù)脫敏工具已落地數(shù)據(jù)標注、城市管理,以及自動駕駛相關(guān)業(yè)務場景。

· 在模型層面,“SenseTrust”能夠針對傳統(tǒng)判別式模型和生成式模型的不同特點提供標準化和定制化的模型評測能力。針對判別式模型,可就能夠面向活體識別、圖像分類、目標檢測等商業(yè)化需求提供一鍵式評測;針對生成式模型,商湯“SenseTrust”構(gòu)建了百萬量級的測試數(shù)據(jù)集,覆蓋三十余類倫理和安全測評維度,可對對抗安全、魯棒安全、后門安全、可解釋性和公平性評測。為進一步提升模型的風險防御能力,商湯“SenseTrust”還能夠提供“AI防火墻”,從源頭過濾對抗樣本,綜合檢出率達到98%。

· 在應用層面,商湯在涉及數(shù)據(jù)保護、數(shù)字取證及偽造檢測等技術(shù)領(lǐng)域有著深厚的積累,并逐步開發(fā)了基于生成、鑒偽和溯源三位一體的綜合解決方案。例如,針對各方頗為關(guān)注的AIGC相關(guān)確權(quán)溯源和鑒偽問題,“SenseTrust”為此開發(fā)了數(shù)字水印解決方案,可將特定信息嵌入到數(shù)字載體中,不影響載體的使用價值,也不易被人察覺,只有通過特定的解碼器和專屬密鑰才能提取,能夠支持多模態(tài)數(shù)據(jù)。數(shù)字水印技術(shù)已服務于“商湯秒畫SenseMirage”、“商湯如影SenseAvatar”等多個產(chǎn)品,以及內(nèi)容創(chuàng)作、大數(shù)據(jù)等領(lǐng)域的客戶。

今年WAIC上,“商湯日日新SenseNova”大模型體系再度升級。針對體系內(nèi)的一系列應用平臺,商湯在傳統(tǒng)“判別式模型”治理經(jīng)驗的基礎(chǔ)上,結(jié)合生成式人工智能的風險特點,利用SenseTrust工具體系進行了一系列測評,并開展持續(xù)的跟蹤測試,不斷提升風險防御能力。

SenseTrust可進行全方位、全鏈路的可信AI檢測與加固

與此同時,商湯也積極將大模型和生成式人工智能的治理實踐成果向外輸出。例如,將商湯“SenseTrust”綜合鑒偽解決方案投入到十余家銀行的安全系統(tǒng)中,實現(xiàn)對各類灰黑產(chǎn)攻擊攔截成功率超行業(yè)同類產(chǎn)品20%以上,有效防范了黑灰產(chǎn)身份盜取、支付盜刷等網(wǎng)絡詐騙。此外,包括模型體檢、數(shù)字水印,以及主動投毒保護等相關(guān)技術(shù),也已通過“商湯AI安全治理開放平臺”對外開放。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )