奔向大模型時代,第一期掘金城市沙龍「 AIGC 技術探索與應用創(chuàng)新」成功舉辦

4 月 13 日,由稀土掘金技術社區(qū)和 Intel 聯(lián)合主辦的 2023 第一期掘金城市沙龍「 AIGC 技術探索與應用創(chuàng)新」在北京成功舉辦。本期沙龍聚焦時下最熱的科技話題——AIGC,通過線上線下聯(lián)動,從“技術”和“應用”雙視角探索 AIGC 爆發(fā)式繁榮背后“算力、算法、數(shù)據(jù)”三大底層能力建設,暢想未來新的產(chǎn)業(yè)結構樣態(tài)與應用創(chuàng)新形式的可能性,在行業(yè)內(nèi)引發(fā)熱烈反響。

本期沙龍分為大咖分享和圓桌 Panel 兩大議程,沙龍現(xiàn)場英特爾 AI 軟件工程師楊亦誠、字節(jié)跳動 NLP 算法工程師陳家澤、Google Cloud 機器學習專家王順、清華大學 KEG 知識工程實驗室研究助理鄭勤鍇、九合創(chuàng)投投資副總裁王逸飛、稀土掘金江昪一一帶來精彩觀點,同大家一道迎接“未來已來,將至未至”的 AIGC 時代。

AIGC 的底層邏輯:以大模型為“道”,衍生萬物

左起:楊亦誠 王順 鄭勤鍇 陳家澤

ChatGPT 爆火,引發(fā)中國互聯(lián)網(wǎng)科技圈對多模態(tài)大模型的關注。在國內(nèi),大模型市場更是開始躁動起來了,文心一言、盤古、通義千問、日日新SenseNova......可以說,從算力到應用,人工智能領域在大模型賽道上已然按下快捷鍵。然而,大模型仍處于從實驗室走向大規(guī)模商業(yè)化的早期階段,存在核心技術不成熟,生態(tài)系統(tǒng)不健全,且成熟落地場景較少等問題。

英特爾 AI 軟件工程師楊亦誠也表示,基于“大算力”和“強算法”兩大顯著特點,AIGC 類的大模型不僅從算力維度給產(chǎn)業(yè)帶來新的技術挑戰(zhàn),更從商業(yè)模型上帶來了突破和變革,可以預見模型服務化勢必成為人工智能企業(yè)未來的核心商業(yè)模式。

盡管視覺相關的 AIGC 領域發(fā)展很猛,但是文本仍是 AIGC 中最重要的一環(huán),是連接不同模態(tài)內(nèi)容的重要媒介。字節(jié)跳動 NLP 算法工程師陳家澤表示,文本生成技術發(fā)展至今,從 Encoder Decoder 結構的第一次變革,之后各種文本生成的應用如同雨后春筍般被提出,到 GPT 結構的發(fā)展,整體文本生成范式發(fā)生演進,過程中帶來更多的可能性,同時也面臨非常多的挑戰(zhàn),比如數(shù)據(jù)隱私和安全的要求越來越高,模型需要具有高可靠性和透明度等等。

同時,隨著高質(zhì)量 AIGC 的大規(guī)模普及,千億規(guī)模大模型的訓練不再高不可攀。Google Cloud 機器學習專家王順也介紹到,Google不斷推出的 LaMDA、Imagen、PaLM、Parti 等生成任務大模型也打磨出了 PAX 這種輕松訓練千億規(guī)模參數(shù)的大模型框架,隨著 Cloud TPU v4 對外部客戶的 GA, 您也可以在 Google Cloud 上輕松訓練一個屬于自己的千億參數(shù)大模型。

在代碼生成的場景中,清華大學 KEG 知識工程實驗室研究助理鄭勤鍇介紹,CodeGeeX正在成為 Github Copilot 的平替,未來絕大多數(shù)代碼都將由AI驅(qū)動產(chǎn)生,每個開發(fā)者都需要尋找成為 AI2.0 程序員的路徑。

AI 的 iPhone 時刻:內(nèi)卷的大模型,擁抱變化的開發(fā)者

AIGC 大模型的參數(shù)天花板在哪里?人工智能是否會取代重復性勞動......面對這些問題,作為圓桌主持人,稀土掘金江昪與一眾嘉賓專家從技術、商業(yè)模式、創(chuàng)新等視角,探討人類之于 AI 以及 AIGC 自身下一步怎么走?

左起:江昪 王逸飛 鄭勤鍇 陳家澤 楊亦誠

隨著自然語言處理與擴散模型的發(fā)展,未來的 AIGC 必然具有極高接近性與創(chuàng)造力。也因此,英偉達CEO黃仁勛四度使用“iPhone時刻”,來形容AI當下的發(fā)展。清華大學 KEG 知識工程實驗室研究助理鄭勤鍇也表示,AI 帶來了交互方式上的變革,極大地提高人們使用各種工具的效率。

2020 年,OpenAI 提出了大模型的縮放法則,也就是說增大參數(shù)規(guī)??梢詷O大提升模型性能,由此進入了煉大模型的“狂飆”時代。而相比于 GPT-3 模型 1750 億參數(shù)量而言,關于 GPT-4 模型參數(shù)量在業(yè)界引發(fā)持續(xù)性猜想。可以確定的是,目前模型的參數(shù)量遠未到達瓶頸。九合創(chuàng)投投資副總裁王逸飛認為,如果在硬件側沒有一個重大突破,可能未來 2、3 年內(nèi)沿著 transformer 路徑走的大模型會走到上限。AGI 是一個很長的探索路徑,未來肯定會有新的算法出來,而目前的 GPT 只是走出最靠前的一步,它很有可能只是我們探索 AGI 的中間態(tài)。

字節(jié)跳動 NLP 算法工程師陳家澤也表示,未來可能有兩條路:一是一部分的模型越來越大,同時也會越來越強;二是在一個差不多量級的模型下水平越來越高,比如可能 7B、 10B 的模型的能力通過一些訓練方式、數(shù)據(jù)調(diào)優(yōu),具備更加充分的能力。

眼下,AIGC 領域熱火朝天,國內(nèi)越來越多的科技企業(yè)扎堆入場。王逸飛也表示,目前,AI 遠未到達最后階段,國內(nèi)企業(yè)或團隊需要面臨最大的挑戰(zhàn)是,如何在沒有明確未來的事情的上敢于做投入,選擇技術路線。

那么,AI 是否會取代重復勞動力的工作,對于包括開發(fā)者在內(nèi)從業(yè)者來說也是一個難題。鄭勤鍇則認為,短期內(nèi)程序員是不太會被替代的,但未來的趨勢可能會分成會用 ChatGPT 和不會用 ChatGPT 這兩類程序員,在此基礎上,對于程序員提出更高的要求,就是 ChatGPT 生成的代碼并不是完全可信的,這時候就要求程序員能判斷 ChatGPT 生成代碼的質(zhì)量。

AI 的長期價值,對各行各業(yè)的顛覆性改變,一切才剛剛開始。從技術研發(fā)到商用階段,再逐步走進現(xiàn)實生活場景中,往往需要一代又一代的開發(fā)者持續(xù)探索和完善,在每一次的技術交流中,凝聚共識,找到新的立身之本。今后,稀土掘金技術社區(qū)還會一如既往地為企業(yè)、技術人員創(chuàng)建一個觀點碰撞的平臺,實現(xiàn)雙向賦能。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )