網(wǎng)絡(luò)安全布局AI研究 安恒信息發(fā)布ChatGPT全面解讀

ChatGPT是OpenAI公司開發(fā)的一個大型預(yù)訓(xùn)練語言模型。根據(jù)UBS發(fā)布的研究報告顯示,ChatGPT在1月份的月活躍用戶數(shù)已經(jīng)達(dá)1億,成為史上用戶增長最快的消費者應(yīng)用。

為什么ChatGPT能在2個月內(nèi)達(dá)到月活過億?這與其卓越的智能程度及豐富的應(yīng)用場景息息相關(guān)。它能在不同行業(yè)促進(jìn)數(shù)實共生,促進(jìn)產(chǎn)業(yè)升級。下文首先會對ChatGPT的原理及應(yīng)用場景進(jìn)行簡單介紹,然后會重點介紹安恒信息在安全領(lǐng)域?qū)hatGPT的研究以及應(yīng)用。

ChatGPT簡介

ChatGPT的算法基于Transformer架構(gòu),這是一種使用自注意力機制處理輸入數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)。Transformer架構(gòu)廣泛應(yīng)用于語言翻譯、文本摘要、問答等自然語言處理任務(wù)。ChatGPT使用了GPT-3.5大規(guī)模語言模型(LLM Large Language Model)并在該模型的基礎(chǔ)上,引入強化學(xué)習(xí)來微調(diào)(fine-turn)預(yù)訓(xùn)練的語言模型。這里的強化學(xué)習(xí)采用的是RLHF(Reinforcement Learning from Human Feedback),即采用人工標(biāo)注的方式。目的是通過其獎勵懲罰機制(reward)讓LLM模型學(xué)會理解各種NLP任務(wù)并學(xué)會從helpfulness、honest、harmless三個維度,判斷什么樣的答案是優(yōu)質(zhì)的。

ChatGPT模型的主要訓(xùn)練流程如下:

1、首先利用一系列問答對模型進(jìn)行監(jiān)督訓(xùn)練(這個操作也叫監(jiān)督指令微調(diào));

2、在完成監(jiān)督指令微調(diào)后,就開始利用強化學(xué)習(xí)(模型在給定的環(huán)境中,不斷地根據(jù)環(huán)境的懲罰和獎勵,擬合到一個最適應(yīng)環(huán)境的狀態(tài))對模型進(jìn)行進(jìn)一步的指令微調(diào),具體地,首先在人類的幫助下訓(xùn)練一個獎賞網(wǎng)絡(luò),這個獎賞網(wǎng)絡(luò)具有對多個聊天回復(fù)好壞進(jìn)行排序的能力;

3、利用這個獎賞網(wǎng)絡(luò),進(jìn)一步通過強化學(xué)習(xí)不斷優(yōu)化模型。

ChatGPT應(yīng)用場景

ChatGPT可以進(jìn)行多輪問答,如實現(xiàn)造句和增加細(xì)節(jié)。

ChatGPT可以用于編寫代碼,如用Python實現(xiàn)快速排序。

ChatGPT可以用于做數(shù)學(xué)題,如計算哥哥要給弟弟多少個蘋果,才能使得哥倆的蘋果數(shù)量相同。

從ChatGPT可以編寫代碼,可以很容易聯(lián)想到編程技術(shù)的門檻降低,這是一把雙刃劍,能被網(wǎng)絡(luò)犯罪集團用來生成攜帶惡意載荷的惡意軟件、編寫巧妙的網(wǎng)絡(luò)釣魚郵件等,普通人嘗試進(jìn)行網(wǎng)絡(luò)攻擊也將變得更加容易。從另一面來講,ChatGPT也可以和安全領(lǐng)域的眾多場景結(jié)合起來,提升安全防護(hù)能力及運營效率。安恒信息已經(jīng)將類ChatGPT的AI算法和智能數(shù)據(jù)分類分級、智能生成檢測規(guī)則、智能告警處置分析、智能客服問答系統(tǒng)、智能釣魚郵件分析、智能加密流量檢測等多個場景進(jìn)行結(jié)合,推進(jìn)研究并逐步落地到產(chǎn)品中。下面將詳細(xì)介紹這6個場景。

智能數(shù)據(jù)分類分級

數(shù)據(jù)分類分級是數(shù)據(jù)安全治理的基石,只有對數(shù)據(jù)進(jìn)行有效分類分級,才能在數(shù)據(jù)安全管理上采用更加精細(xì)的控制。分類分級的依據(jù)通常來源于法律法規(guī)、行業(yè)標(biāo)準(zhǔn)或地區(qū)標(biāo)準(zhǔn)文件,例如《JR/T 0197-2020 金融數(shù)據(jù)安全 數(shù)據(jù)安全分級指南》中規(guī)定微信號、手機號等個人聯(lián)系信息的最低安全級別為3級。專業(yè)的數(shù)據(jù)安全分類分級服務(wù)人員通過熟悉這些標(biāo)準(zhǔn)文件,憑主觀判斷完成數(shù)據(jù)的類別級別梳理工作。

人工智能模型在數(shù)據(jù)安全分類分級場景中占據(jù)越來越重要的地位,正在逐步取代人工繁瑣單調(diào)的數(shù)據(jù)分類分級標(biāo)注工作?;趶娀瘜W(xué)習(xí)的人工智能模型已經(jīng)在安恒信息AiSort數(shù)據(jù)安全分級產(chǎn)品中部署應(yīng)用,AiSort能夠精準(zhǔn)識別數(shù)據(jù)業(yè)務(wù)含義,進(jìn)行自動分類分級,大幅提高數(shù)據(jù)梳理的工作效率。

強化學(xué)習(xí) RLH流程示意

AiSort 內(nèi)置了融合法律法規(guī)、行業(yè)標(biāo)準(zhǔn)等領(lǐng)域知識的預(yù)訓(xùn)練模型,同時支持模型有監(jiān)督訓(xùn)練。用戶利用有標(biāo)簽的數(shù)據(jù)源對模型進(jìn)行訓(xùn)練,學(xué)習(xí)數(shù)據(jù)的特征與類別級別之間的內(nèi)在關(guān)聯(lián),可預(yù)測出其它類似數(shù)據(jù)源的分類分級結(jié)果。產(chǎn)品在交互中接收人工反饋,引入強化學(xué)習(xí) RLHF(Reinforcement Learning from Human Feedback)來微調(diào)預(yù)訓(xùn)練的分類分級模型,在模型給出的候選分類分級結(jié)果中選擇最優(yōu)結(jié)果,通過獎勵懲罰機制使模型不斷優(yōu)化自身,訓(xùn)練出一個分類分級領(lǐng)域適合客戶的專有AI模型。

產(chǎn)品可根據(jù)數(shù)據(jù)的內(nèi)容和描述等特征給出正確的分級結(jié)果,并且理解并引用標(biāo)準(zhǔn)文件中判斷依據(jù),幫助服務(wù)人員提升數(shù)據(jù)治理工作效率,在不同行業(yè)、不同業(yè)務(wù)條件下都能提供更加優(yōu)質(zhì)的數(shù)據(jù)安全分類分級服務(wù)。

智能生成檢測規(guī)則

檢測規(guī)則是檢測網(wǎng)絡(luò)入侵,保護(hù)網(wǎng)絡(luò)安全的重要手段。當(dāng)前大部分的網(wǎng)絡(luò)安全規(guī)則主要是依靠安全研究人員的經(jīng)驗來制作的,面對黑客層出不窮的攻擊手段,專家經(jīng)驗的規(guī)則存在誤報和無法識別新的攻擊的問題。ChatGPT可以幫助更好地自動生成檢測規(guī)則。

針對內(nèi)網(wǎng)環(huán)境,ChatGPT可以根據(jù)客戶現(xiàn)場對誤報的處理,從大量的原始日志、告警信息、誤報中自動學(xué)習(xí),自動生成檢測規(guī)則。例如自動學(xué)習(xí)運營人員經(jīng)常對哪些IP及端口的告警進(jìn)行誤報標(biāo)記,給出生成檢測規(guī)則的建議,并對這些IP及端口加入白名單或者封禁。

針對云上環(huán)境。ChatGPT可以利用安恒信息MSS安全托管運營服務(wù)平臺大量收集全國數(shù)據(jù),在此基礎(chǔ)上研究場景,利用強化學(xué)習(xí)訓(xùn)練模型和人工反饋不斷調(diào)試優(yōu)化。開發(fā)運營反饋模塊,針對告警排查過程中的各種日志證據(jù),進(jìn)行錄入上報,利用ChatGPT學(xué)習(xí)到其中的模式并自動生成告警規(guī)則,在降低誤報的同時也可以對新產(chǎn)生的攻擊方式和手法自動生成檢測規(guī)則。

智能告警處置分析

告警分析是安全運營的核心內(nèi)容。伴隨著組織機構(gòu)的擴張、業(yè)務(wù)邏輯的復(fù)雜化,一個大中型企業(yè)每日的告警量很容易達(dá)到百萬量級,從海量告警中篩選出重要風(fēng)險事件給安全運營人員帶來沉重負(fù)擔(dān)。ChatGPT技術(shù)在告警響應(yīng)處置中發(fā)揮重要作用。

針對告警處置,ChatGPT可以學(xué)習(xí)安全分析師對各類風(fēng)險場景的處置動作,自動生成處置規(guī)則。借助運營反饋模塊,將告警排查過程中的各種日志證據(jù)進(jìn)行錄入上報。針對云上環(huán)境,可以利用MSS平臺收集全國數(shù)據(jù)。在此大量數(shù)據(jù)基礎(chǔ)上訓(xùn)練用于風(fēng)險研判的ChatGPT模型。針對特定告警和風(fēng)險場景,由模型生成若干處置建議,通過人工反饋訓(xùn)練模型判斷出最優(yōu)的處置動作,使其學(xué)會生成正確的處置規(guī)則。

在日常的運營過程中,使用ChatGPT技術(shù)學(xué)習(xí)大量歷史運營分析報告內(nèi)容之后,能夠針對各類安全設(shè)備產(chǎn)生的告警事件和統(tǒng)計指標(biāo),迅速生成分析報告、捕捉關(guān)鍵異常、生成處置建議,協(xié)助分析師更快地洞察事件全貌。

智能客服問答系統(tǒng)

隨著產(chǎn)品數(shù)量種類的增加,不同產(chǎn)品的安裝部署、系統(tǒng)運維、常見問題、安全服務(wù)等都不盡相同,面對大量不同客戶的不同問題,如果僅僅依靠人工的方式來集解答和處理,會極大增加人工的成本。

使用ChatGPT技術(shù),通過對不同產(chǎn)品的各類文檔和客戶常見問題的學(xué)習(xí),使用強化學(xué)習(xí)的方式來訓(xùn)練一個智能客服問答系統(tǒng),系統(tǒng)可以根據(jù)大量的<問題,解答>對學(xué)習(xí)到不同文檔中的知識,并且可以在實踐的過程中根據(jù)人工反饋不斷微調(diào)以優(yōu)化系統(tǒng)。智能客服問答系統(tǒng),可以及時的響應(yīng)客戶在網(wǎng)頁端提出的關(guān)于系統(tǒng)、產(chǎn)品、運維等相關(guān)的常見問題,從而有效降低人力溝通成本。

當(dāng)前,安恒信息已經(jīng)根據(jù)多年積累的數(shù)據(jù)訓(xùn)練了初步的模型,并在公司內(nèi)部開始試用,模型可以實現(xiàn)常見系統(tǒng)問題的應(yīng)答,另外,對于智能語音問答方面也在積極的探索。

智能釣魚郵件分析

群發(fā)式釣魚郵件和針對式魚叉攻擊都仍然是目前網(wǎng)絡(luò)攻擊的一種主要途徑。它通過發(fā)送一封看似是從信任的發(fā)件人發(fā)出的電子郵件,來誘導(dǎo)收件人提供個人信息(如用戶名、密碼、銀行賬號)或者打開惡意網(wǎng)站或附件。如何精準(zhǔn)識別、攔截潛在的釣魚郵件,是網(wǎng)絡(luò)安全領(lǐng)域重要的研究方向。

一方面,ChatGPT使得海量、自動化、多樣性的生成釣魚郵件模版變成一件很容易的事情。攻擊者可以通過指定的社工關(guān)鍵字,根據(jù)每個目標(biāo)人物特點,針對性的生成釣魚郵件,ChatGPT大幅降低偽造的人工成本,同時最大程度提高了釣魚郵件成功率。

另一方面,安恒信息從多年累積的攻防實踐經(jīng)驗出發(fā),基于AI技術(shù),聯(lián)動郵件附件智能沙箱技術(shù)、郵件正文語言分析技術(shù)和郵件收發(fā)賬號UEBA技術(shù),可以準(zhǔn)確識別可疑郵件、及時做出釣魚郵件預(yù)警。同時,未來將積極追蹤研究Bard、ChatGPT等大型語言模型,試驗?zāi)P蛢?nèi)容指紋技術(shù),自動化分析判別郵件內(nèi)容來源。對非自然人構(gòu)建的語言內(nèi)容及時給出提醒,并作為釣魚郵件告警系統(tǒng)的重要輸入維度,全方位守護(hù)用戶的郵件安全。

智能加密流量檢測

隨著新一代網(wǎng)絡(luò)技術(shù)的發(fā)展,如云計算和物聯(lián)網(wǎng),加密技術(shù)的使用提高了數(shù)據(jù)傳輸?shù)陌踩?,但也為網(wǎng)絡(luò)安全帶來了更大的挑戰(zhàn),攻擊者可以利用加密技術(shù)傳輸敏感信息和惡意數(shù)據(jù)。

使用ChatGPT技術(shù)可以幫助網(wǎng)絡(luò)安全領(lǐng)域的專家們構(gòu)建科學(xué)的加密流量分析方案,通過分析網(wǎng)絡(luò)流量,以及應(yīng)用層面的安全檢測,實現(xiàn)加密流量的安全檢測,有效的抵御惡意攻擊。ChatGPT技術(shù)在加密流量檢測中可以通過分析網(wǎng)絡(luò)流量,用來分析密鑰空間,檢測攻擊模式,以及識別攻擊行為來發(fā)現(xiàn)未知的網(wǎng)絡(luò)攻擊。ChatGPT技術(shù)的應(yīng)用可以讓網(wǎng)絡(luò)安全管理者更有效地發(fā)現(xiàn)、識別和響應(yīng)安全漏洞和攻擊行為,為網(wǎng)絡(luò)安全實現(xiàn)有效把控提供有力保障。另外,ChatGPT技術(shù)可以分析攻擊者行為、以及及時響應(yīng)各種威脅,為安全團隊提供有效的應(yīng)對措施。

安恒信息的EMT智能流量檢測系統(tǒng)是一個支持大規(guī)模網(wǎng)絡(luò)全流量捕獲、檢索,網(wǎng)絡(luò)攻擊檢測、分析,威脅行為評估、 溯源的綜合系統(tǒng)。EMT智能流量檢測系統(tǒng)可以結(jié)合ChatGPT技術(shù)進(jìn)行更全面的流量分析,通過深度分析加速網(wǎng)絡(luò)威脅檢測,實時發(fā)現(xiàn)和響應(yīng)所有攻擊行為,以及未知的攻擊模式。

人工智能未來已來,網(wǎng)絡(luò)安全在這個時代也將發(fā)生巨變,新的攻擊形式層出不窮,對檢測及防護(hù)能力也必將提出新的要求。安恒信息一直擁抱AI變化,積極布局AI前沿研究。產(chǎn)品逐步AI智能化是安恒信息實現(xiàn)“構(gòu)建安全可信的數(shù)字世界”企業(yè)使命的必經(jīng)之路。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )