ChatGPT是OpenAI公司開發(fā)的一個(gè)大型預(yù)訓(xùn)練語(yǔ)言模型。根據(jù)UBS發(fā)布的研究報(bào)告顯示,ChatGPT在1月份的月活躍用戶數(shù)已經(jīng)達(dá)1億,成為史上用戶增長(zhǎng)最快的消費(fèi)者應(yīng)用。
為什么ChatGPT能在2個(gè)月內(nèi)達(dá)到月活過(guò)億?這與其卓越的智能程度及豐富的應(yīng)用場(chǎng)景息息相關(guān)。它能在不同行業(yè)促進(jìn)數(shù)實(shí)共生,促進(jìn)產(chǎn)業(yè)升級(jí)。下文首先會(huì)對(duì)ChatGPT的原理及應(yīng)用場(chǎng)景進(jìn)行簡(jiǎn)單介紹,然后會(huì)重點(diǎn)介紹安恒信息在安全領(lǐng)域?qū)hatGPT的研究以及應(yīng)用。
ChatGPT簡(jiǎn)介
ChatGPT的算法基于Transformer架構(gòu),這是一種使用自注意力機(jī)制處理輸入數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)。Transformer架構(gòu)廣泛應(yīng)用于語(yǔ)言翻譯、文本摘要、問(wèn)答等自然語(yǔ)言處理任務(wù)。ChatGPT使用了GPT-3.5大規(guī)模語(yǔ)言模型(LLM Large Language Model)并在該模型的基礎(chǔ)上,引入強(qiáng)化學(xué)習(xí)來(lái)微調(diào)(fine-turn)預(yù)訓(xùn)練的語(yǔ)言模型。這里的強(qiáng)化學(xué)習(xí)采用的是RLHF(Reinforcement Learning from Human Feedback),即采用人工標(biāo)注的方式。目的是通過(guò)其獎(jiǎng)勵(lì)懲罰機(jī)制(reward)讓LLM模型學(xué)會(huì)理解各種NLP任務(wù)并學(xué)會(huì)從helpfulness、honest、harmless三個(gè)維度,判斷什么樣的答案是優(yōu)質(zhì)的。
ChatGPT模型的主要訓(xùn)練流程如下:
1、首先利用一系列問(wèn)答對(duì)模型進(jìn)行監(jiān)督訓(xùn)練(這個(gè)操作也叫監(jiān)督指令微調(diào));
2、在完成監(jiān)督指令微調(diào)后,就開始利用強(qiáng)化學(xué)習(xí)(模型在給定的環(huán)境中,不斷地根據(jù)環(huán)境的懲罰和獎(jiǎng)勵(lì),擬合到一個(gè)最適應(yīng)環(huán)境的狀態(tài))對(duì)模型進(jìn)行進(jìn)一步的指令微調(diào),具體地,首先在人類的幫助下訓(xùn)練一個(gè)獎(jiǎng)賞網(wǎng)絡(luò),這個(gè)獎(jiǎng)賞網(wǎng)絡(luò)具有對(duì)多個(gè)聊天回復(fù)好壞進(jìn)行排序的能力;
3、利用這個(gè)獎(jiǎng)賞網(wǎng)絡(luò),進(jìn)一步通過(guò)強(qiáng)化學(xué)習(xí)不斷優(yōu)化模型。
ChatGPT應(yīng)用場(chǎng)景
ChatGPT可以進(jìn)行多輪問(wèn)答,如實(shí)現(xiàn)造句和增加細(xì)節(jié)。
ChatGPT可以用于編寫代碼,如用Python實(shí)現(xiàn)快速排序。
ChatGPT可以用于做數(shù)學(xué)題,如計(jì)算哥哥要給弟弟多少個(gè)蘋果,才能使得哥倆的蘋果數(shù)量相同。
從ChatGPT可以編寫代碼,可以很容易聯(lián)想到編程技術(shù)的門檻降低,這是一把雙刃劍,能被網(wǎng)絡(luò)犯罪集團(tuán)用來(lái)生成攜帶惡意載荷的惡意軟件、編寫巧妙的網(wǎng)絡(luò)釣魚郵件等,普通人嘗試進(jìn)行網(wǎng)絡(luò)攻擊也將變得更加容易。從另一面來(lái)講,ChatGPT也可以和安全領(lǐng)域的眾多場(chǎng)景結(jié)合起來(lái),提升安全防護(hù)能力及運(yùn)營(yíng)效率。安恒信息已經(jīng)將類ChatGPT的AI算法和智能數(shù)據(jù)分類分級(jí)、智能生成檢測(cè)規(guī)則、智能告警處置分析、智能客服問(wèn)答系統(tǒng)、智能釣魚郵件分析、智能加密流量檢測(cè)等多個(gè)場(chǎng)景進(jìn)行結(jié)合,推進(jìn)研究并逐步落地到產(chǎn)品中。下面將詳細(xì)介紹這6個(gè)場(chǎng)景。
智能數(shù)據(jù)分類分級(jí)
數(shù)據(jù)分類分級(jí)是數(shù)據(jù)安全治理的基石,只有對(duì)數(shù)據(jù)進(jìn)行有效分類分級(jí),才能在數(shù)據(jù)安全管理上采用更加精細(xì)的控制。分類分級(jí)的依據(jù)通常來(lái)源于法律法規(guī)、行業(yè)標(biāo)準(zhǔn)或地區(qū)標(biāo)準(zhǔn)文件,例如《JR/T 0197-2020 金融數(shù)據(jù)安全 數(shù)據(jù)安全分級(jí)指南》中規(guī)定微信號(hào)、手機(jī)號(hào)等個(gè)人聯(lián)系信息的最低安全級(jí)別為3級(jí)。專業(yè)的數(shù)據(jù)安全分類分級(jí)服務(wù)人員通過(guò)熟悉這些標(biāo)準(zhǔn)文件,憑主觀判斷完成數(shù)據(jù)的類別級(jí)別梳理工作。
人工智能模型在數(shù)據(jù)安全分類分級(jí)場(chǎng)景中占據(jù)越來(lái)越重要的地位,正在逐步取代人工繁瑣單調(diào)的數(shù)據(jù)分類分級(jí)標(biāo)注工作?;趶?qiáng)化學(xué)習(xí)的人工智能模型已經(jīng)在安恒信息AiSort數(shù)據(jù)安全分級(jí)產(chǎn)品中部署應(yīng)用,AiSort能夠精準(zhǔn)識(shí)別數(shù)據(jù)業(yè)務(wù)含義,進(jìn)行自動(dòng)分類分級(jí),大幅提高數(shù)據(jù)梳理的工作效率。
強(qiáng)化學(xué)習(xí) RLH流程示意
AiSort 內(nèi)置了融合法律法規(guī)、行業(yè)標(biāo)準(zhǔn)等領(lǐng)域知識(shí)的預(yù)訓(xùn)練模型,同時(shí)支持模型有監(jiān)督訓(xùn)練。用戶利用有標(biāo)簽的數(shù)據(jù)源對(duì)模型進(jìn)行訓(xùn)練,學(xué)習(xí)數(shù)據(jù)的特征與類別級(jí)別之間的內(nèi)在關(guān)聯(lián),可預(yù)測(cè)出其它類似數(shù)據(jù)源的分類分級(jí)結(jié)果。產(chǎn)品在交互中接收人工反饋,引入強(qiáng)化學(xué)習(xí) RLHF(Reinforcement Learning from Human Feedback)來(lái)微調(diào)預(yù)訓(xùn)練的分類分級(jí)模型,在模型給出的候選分類分級(jí)結(jié)果中選擇最優(yōu)結(jié)果,通過(guò)獎(jiǎng)勵(lì)懲罰機(jī)制使模型不斷優(yōu)化自身,訓(xùn)練出一個(gè)分類分級(jí)領(lǐng)域適合客戶的專有AI模型。
產(chǎn)品可根據(jù)數(shù)據(jù)的內(nèi)容和描述等特征給出正確的分級(jí)結(jié)果,并且理解并引用標(biāo)準(zhǔn)文件中判斷依據(jù),幫助服務(wù)人員提升數(shù)據(jù)治理工作效率,在不同行業(yè)、不同業(yè)務(wù)條件下都能提供更加優(yōu)質(zhì)的數(shù)據(jù)安全分類分級(jí)服務(wù)。
智能生成檢測(cè)規(guī)則
檢測(cè)規(guī)則是檢測(cè)網(wǎng)絡(luò)入侵,保護(hù)網(wǎng)絡(luò)安全的重要手段。當(dāng)前大部分的網(wǎng)絡(luò)安全規(guī)則主要是依靠安全研究人員的經(jīng)驗(yàn)來(lái)制作的,面對(duì)黑客層出不窮的攻擊手段,專家經(jīng)驗(yàn)的規(guī)則存在誤報(bào)和無(wú)法識(shí)別新的攻擊的問(wèn)題。ChatGPT可以幫助更好地自動(dòng)生成檢測(cè)規(guī)則。
針對(duì)內(nèi)網(wǎng)環(huán)境,ChatGPT可以根據(jù)客戶現(xiàn)場(chǎng)對(duì)誤報(bào)的處理,從大量的原始日志、告警信息、誤報(bào)中自動(dòng)學(xué)習(xí),自動(dòng)生成檢測(cè)規(guī)則。例如自動(dòng)學(xué)習(xí)運(yùn)營(yíng)人員經(jīng)常對(duì)哪些IP及端口的告警進(jìn)行誤報(bào)標(biāo)記,給出生成檢測(cè)規(guī)則的建議,并對(duì)這些IP及端口加入白名單或者封禁。
針對(duì)云上環(huán)境。ChatGPT可以利用安恒信息MSS安全托管運(yùn)營(yíng)服務(wù)平臺(tái)大量收集全國(guó)數(shù)據(jù),在此基礎(chǔ)上研究場(chǎng)景,利用強(qiáng)化學(xué)習(xí)訓(xùn)練模型和人工反饋不斷調(diào)試優(yōu)化。開發(fā)運(yùn)營(yíng)反饋模塊,針對(duì)告警排查過(guò)程中的各種日志證據(jù),進(jìn)行錄入上報(bào),利用ChatGPT學(xué)習(xí)到其中的模式并自動(dòng)生成告警規(guī)則,在降低誤報(bào)的同時(shí)也可以對(duì)新產(chǎn)生的攻擊方式和手法自動(dòng)生成檢測(cè)規(guī)則。
智能告警處置分析
告警分析是安全運(yùn)營(yíng)的核心內(nèi)容。伴隨著組織機(jī)構(gòu)的擴(kuò)張、業(yè)務(wù)邏輯的復(fù)雜化,一個(gè)大中型企業(yè)每日的告警量很容易達(dá)到百萬(wàn)量級(jí),從海量告警中篩選出重要風(fēng)險(xiǎn)事件給安全運(yùn)營(yíng)人員帶來(lái)沉重負(fù)擔(dān)。ChatGPT技術(shù)在告警響應(yīng)處置中發(fā)揮重要作用。
針對(duì)告警處置,ChatGPT可以學(xué)習(xí)安全分析師對(duì)各類風(fēng)險(xiǎn)場(chǎng)景的處置動(dòng)作,自動(dòng)生成處置規(guī)則。借助運(yùn)營(yíng)反饋模塊,將告警排查過(guò)程中的各種日志證據(jù)進(jìn)行錄入上報(bào)。針對(duì)云上環(huán)境,可以利用MSS平臺(tái)收集全國(guó)數(shù)據(jù)。在此大量數(shù)據(jù)基礎(chǔ)上訓(xùn)練用于風(fēng)險(xiǎn)研判的ChatGPT模型。針對(duì)特定告警和風(fēng)險(xiǎn)場(chǎng)景,由模型生成若干處置建議,通過(guò)人工反饋訓(xùn)練模型判斷出最優(yōu)的處置動(dòng)作,使其學(xué)會(huì)生成正確的處置規(guī)則。
在日常的運(yùn)營(yíng)過(guò)程中,使用ChatGPT技術(shù)學(xué)習(xí)大量歷史運(yùn)營(yíng)分析報(bào)告內(nèi)容之后,能夠針對(duì)各類安全設(shè)備產(chǎn)生的告警事件和統(tǒng)計(jì)指標(biāo),迅速生成分析報(bào)告、捕捉關(guān)鍵異常、生成處置建議,協(xié)助分析師更快地洞察事件全貌。
智能客服問(wèn)答系統(tǒng)
隨著產(chǎn)品數(shù)量種類的增加,不同產(chǎn)品的安裝部署、系統(tǒng)運(yùn)維、常見問(wèn)題、安全服務(wù)等都不盡相同,面對(duì)大量不同客戶的不同問(wèn)題,如果僅僅依靠人工的方式來(lái)集解答和處理,會(huì)極大增加人工的成本。
使用ChatGPT技術(shù),通過(guò)對(duì)不同產(chǎn)品的各類文檔和客戶常見問(wèn)題的學(xué)習(xí),使用強(qiáng)化學(xué)習(xí)的方式來(lái)訓(xùn)練一個(gè)智能客服問(wèn)答系統(tǒng),系統(tǒng)可以根據(jù)大量的<問(wèn)題,解答>對(duì)學(xué)習(xí)到不同文檔中的知識(shí),并且可以在實(shí)踐的過(guò)程中根據(jù)人工反饋不斷微調(diào)以優(yōu)化系統(tǒng)。智能客服問(wèn)答系統(tǒng),可以及時(shí)的響應(yīng)客戶在網(wǎng)頁(yè)端提出的關(guān)于系統(tǒng)、產(chǎn)品、運(yùn)維等相關(guān)的常見問(wèn)題,從而有效降低人力溝通成本。
當(dāng)前,安恒信息已經(jīng)根據(jù)多年積累的數(shù)據(jù)訓(xùn)練了初步的模型,并在公司內(nèi)部開始試用,模型可以實(shí)現(xiàn)常見系統(tǒng)問(wèn)題的應(yīng)答,另外,對(duì)于智能語(yǔ)音問(wèn)答方面也在積極的探索。
智能釣魚郵件分析
群發(fā)式釣魚郵件和針對(duì)式魚叉攻擊都仍然是目前網(wǎng)絡(luò)攻擊的一種主要途徑。它通過(guò)發(fā)送一封看似是從信任的發(fā)件人發(fā)出的電子郵件,來(lái)誘導(dǎo)收件人提供個(gè)人信息(如用戶名、密碼、銀行賬號(hào))或者打開惡意網(wǎng)站或附件。如何精準(zhǔn)識(shí)別、攔截潛在的釣魚郵件,是網(wǎng)絡(luò)安全領(lǐng)域重要的研究方向。
一方面,ChatGPT使得海量、自動(dòng)化、多樣性的生成釣魚郵件模版變成一件很容易的事情。攻擊者可以通過(guò)指定的社工關(guān)鍵字,根據(jù)每個(gè)目標(biāo)人物特點(diǎn),針對(duì)性的生成釣魚郵件,ChatGPT大幅降低偽造的人工成本,同時(shí)最大程度提高了釣魚郵件成功率。
另一方面,安恒信息從多年累積的攻防實(shí)踐經(jīng)驗(yàn)出發(fā),基于AI技術(shù),聯(lián)動(dòng)郵件附件智能沙箱技術(shù)、郵件正文語(yǔ)言分析技術(shù)和郵件收發(fā)賬號(hào)UEBA技術(shù),可以準(zhǔn)確識(shí)別可疑郵件、及時(shí)做出釣魚郵件預(yù)警。同時(shí),未來(lái)將積極追蹤研究Bard、ChatGPT等大型語(yǔ)言模型,試驗(yàn)?zāi)P蛢?nèi)容指紋技術(shù),自動(dòng)化分析判別郵件內(nèi)容來(lái)源。對(duì)非自然人構(gòu)建的語(yǔ)言內(nèi)容及時(shí)給出提醒,并作為釣魚郵件告警系統(tǒng)的重要輸入維度,全方位守護(hù)用戶的郵件安全。
智能加密流量檢測(cè)
隨著新一代網(wǎng)絡(luò)技術(shù)的發(fā)展,如云計(jì)算和物聯(lián)網(wǎng),加密技術(shù)的使用提高了數(shù)據(jù)傳輸?shù)陌踩?,但也為網(wǎng)絡(luò)安全帶來(lái)了更大的挑戰(zhàn),攻擊者可以利用加密技術(shù)傳輸敏感信息和惡意數(shù)據(jù)。
使用ChatGPT技術(shù)可以幫助網(wǎng)絡(luò)安全領(lǐng)域的專家們構(gòu)建科學(xué)的加密流量分析方案,通過(guò)分析網(wǎng)絡(luò)流量,以及應(yīng)用層面的安全檢測(cè),實(shí)現(xiàn)加密流量的安全檢測(cè),有效的抵御惡意攻擊。ChatGPT技術(shù)在加密流量檢測(cè)中可以通過(guò)分析網(wǎng)絡(luò)流量,用來(lái)分析密鑰空間,檢測(cè)攻擊模式,以及識(shí)別攻擊行為來(lái)發(fā)現(xiàn)未知的網(wǎng)絡(luò)攻擊。ChatGPT技術(shù)的應(yīng)用可以讓網(wǎng)絡(luò)安全管理者更有效地發(fā)現(xiàn)、識(shí)別和響應(yīng)安全漏洞和攻擊行為,為網(wǎng)絡(luò)安全實(shí)現(xiàn)有效把控提供有力保障。另外,ChatGPT技術(shù)可以分析攻擊者行為、以及及時(shí)響應(yīng)各種威脅,為安全團(tuán)隊(duì)提供有效的應(yīng)對(duì)措施。
安恒信息的EMT智能流量檢測(cè)系統(tǒng)是一個(gè)支持大規(guī)模網(wǎng)絡(luò)全流量捕獲、檢索,網(wǎng)絡(luò)攻擊檢測(cè)、分析,威脅行為評(píng)估、 溯源的綜合系統(tǒng)。EMT智能流量檢測(cè)系統(tǒng)可以結(jié)合ChatGPT技術(shù)進(jìn)行更全面的流量分析,通過(guò)深度分析加速網(wǎng)絡(luò)威脅檢測(cè),實(shí)時(shí)發(fā)現(xiàn)和響應(yīng)所有攻擊行為,以及未知的攻擊模式。
人工智能未來(lái)已來(lái),網(wǎng)絡(luò)安全在這個(gè)時(shí)代也將發(fā)生巨變,新的攻擊形式層出不窮,對(duì)檢測(cè)及防護(hù)能力也必將提出新的要求。安恒信息一直擁抱AI變化,積極布局AI前沿研究。產(chǎn)品逐步AI智能化是安恒信息實(shí)現(xiàn)“構(gòu)建安全可信的數(shù)字世界”企業(yè)使命的必經(jīng)之路。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )