亚洲精品韩国美女在线,欧美护士激情第一欧美精品,久久婷婷五月综合97色一本一本

丨劃重點

1. 大模型火爆是因為在開放領(lǐng)域任務(wù)上超預期的表現(xiàn)，尤其是具備理解能力，可以將其稱之為「智能涌現(xiàn)」。

2. 基礎(chǔ)大模型的訓練是基于公開、經(jīng)過整理的可信內(nèi)容，而下游任務(wù)（比方說對話任務(wù)）則需要對特定的數(shù)據(jù)進行人工標記。

3. 頭部大廠和資深從業(yè)者紛紛下場創(chuàng)業(yè)，人才與市場將是中國大模型的優(yōu)勢。

4. 大模型扎堆有助于人才培養(yǎng)，暫時還是小規(guī)模試驗，不會出現(xiàn)并購、倒閉潮。

5. 大型模型是一個產(chǎn)品和工具，提供方應(yīng)該承擔責任，停止所有AI或大模型產(chǎn)品開發(fā)不太可能。

丨概述

過去一個季度，GPT-3.5和GPT-4持續(xù)的在全網(wǎng)刷屏，成功將OpenAI推上科技創(chuàng)新風口，也間接帶火了大語言模型創(chuàng)業(yè)浪潮。

在硅谷，微軟率先在產(chǎn)品中接入ChatGPT，谷歌也推出了自己的Bard模型；在中國內(nèi)地，百度、阿里巴巴們先后推出了文心一言、通義千問，王小川、王慧文等資深互聯(lián)網(wǎng)從業(yè)者，先后投身到大模型創(chuàng)業(yè)當中。

然而，大模型在刷新人們對人工智能能力認知上限的同時，也因為在倫理、道德等方面存在的問題而引發(fā)爭議，也因此馬斯克等知名從業(yè)者發(fā)起了聯(lián)名信，呼吁暫停GPT-4以上大模型6個月的研發(fā)時間，從而引發(fā)行業(yè)大討論。

4月19日20:00，《亮見》聯(lián)合騰訊科技，特邀清華大學國強教授、智能產(chǎn)業(yè)研究院首席研究員聶再清博士，為公眾梳理人工智能發(fā)展過程中的問題與挑戰(zhàn)以及創(chuàng)業(yè)機會。

以下是直播文字精華版：

訓練數(shù)據(jù)爆發(fā)讓大模型「智能涌現(xiàn)」

劉興亮：能否簡要介紹大模型是什么，能做些什么？

聶再清：大模型即大規(guī)模預訓練模型，是使用海量數(shù)據(jù)進行預訓練的深度學習模型，這些模型一般具有大量參數(shù)，可以理解為人類知識和語言的壓縮器。

大模型的應(yīng)用場景豐富，對于英文水平不夠好的人，英語翻譯就是最有用的場景。眾所周知，許多國際期刊要求論文用英語寫作，這給中國研究人員帶來了不利因素。然而，通過ChatGPT這類產(chǎn)品，可以很好的幫助作者提高英語論文的流利度，當然還有許多人使用它來輔助準備演講稿、總結(jié)，甚至創(chuàng)作詩歌等等。

大模型也具備將搜索結(jié)果和其他信息結(jié)合在一起的能力，不過不能保證每一條結(jié)果都是正確的，但大部分通過搜索結(jié)果總結(jié)出的內(nèi)容是可信的。

和過去相比，搜索引擎提供了查找信息的能力，大模型為我們提供了更廣闊的想象空間。當越來越多的第三方廠商加入這個領(lǐng)域時，它們可以在我們的日常生活中提供更多的便利的插件，這也是當初我們開發(fā)智能助手時的愿景，希望它能成為新的交互入口。

劉興亮：現(xiàn)在大模型非常的火爆，主要原因是什么，它是如何發(fā)展到現(xiàn)在的？

聶再清：大模型火爆主要是因為在開放領(lǐng)域任務(wù)上的表現(xiàn)，讓人出乎意料，具備理解能力，我稱之為智能涌現(xiàn)，其能力的提升則是通過增加數(shù)據(jù)量的同時，擴大模型參數(shù)規(guī)模來實現(xiàn)的。通過模型規(guī)模擴大帶來了能力的提升，也帶來了不同階段的下游任務(wù)學習范式

它的發(fā)展歷程主要分為三個階段：

第一階段（預訓練+Fine-tuning）：2018年左右這個領(lǐng)域開始被廣泛關(guān)注，預訓練模型不是非常大。在下游機器學習的自然語言任務(wù)上，通過使用一些訓練數(shù)據(jù)，可以顯著提高任務(wù)處理能力。

第二階段（預訓練+Prompt-tuning），2019年后，GPT-2和GPT-3這些模型陸續(xù)亮相，這些模型具有提示學習的能力，可以在只給定幾個示例的情況下預測完成下游文本任務(wù)。

第三階段（預訓練+Instruction-tuning），2022年后，出現(xiàn)了被稱為Instruction Learning的學習范式，可以通過在前n個任務(wù)上進行學習，提升在第n+1個任務(wù)上進行預測的性能，主要優(yōu)點是讓模型更加通用和開放，可以應(yīng)用于更廣泛的任務(wù)和場景。

劉興亮：大模型的數(shù)據(jù)是從哪里來，使用權(quán)限如何界定，有哪些手段來保障數(shù)據(jù)的安全，尤其是生物醫(yī)藥的數(shù)據(jù)安全又怎么樣去保障？

聶再清：在基礎(chǔ)大模型訓練階段主要使用公共數(shù)據(jù)，包括我們的BioMedGPT也是基于公開數(shù)據(jù)構(gòu)建的。

語言模型更多地使用百科全書、新聞、電子書等由人類撰寫的、更為真實的文本，這些經(jīng)過整理的、真實的、具備人類智慧的文本被輸入到這個模型中，讓它學會更多的知識。

在利用大模型解決下游任務(wù)階段，可能需要標注更多的任務(wù)相關(guān)數(shù)據(jù)，需要花費一定的費用。

比如GPT3發(fā)布初期，業(yè)界可能沒有感到驚艷，直到有了切實的對話大模型（ChatGPT），讓用戶標注對話數(shù)據(jù)以完成不同領(lǐng)域的對話任務(wù)，才讓每個人感到驚奇，而這種能力是通過用戶對話數(shù)據(jù)標注和強化學習來獲得的。

除了標注，還有一部分數(shù)據(jù)是用戶反饋的，這些數(shù)據(jù)可以幫助提高系統(tǒng)能力，也很有價值的。

還有一部分數(shù)據(jù)來自模型的客戶或個人用戶的私有數(shù)據(jù)，客戶可能會提供大量數(shù)據(jù)用于回答問題，但這部分數(shù)據(jù)應(yīng)該屬于客戶或用戶私有，不用用來訓練公共使用的大模型。需要注意保護客戶和個人用戶的隱私。

因此，需要區(qū)分不同類型的數(shù)據(jù)，并授權(quán)相應(yīng)的權(quán)限，有些數(shù)據(jù)只能由用戶處理，有些數(shù)據(jù)可供平臺公司使用，但隱私數(shù)據(jù)絕對不能使用。

人才與市場將是中國大模型的優(yōu)勢

劉興亮：頭部大廠、知名人士紛紛下場做大模型創(chuàng)業(yè)，他們各自都有哪些長處和短處？

聶再清：我認為大模型應(yīng)用可分為三類，對應(yīng)著不同類型的團隊。

第一類是提供云服務(wù)的大廠，他們需要在其基礎(chǔ)設(shè)施上提供高質(zhì)量的大型模型服務(wù)。未來是大模型的時代，沒有這樣的服務(wù)，就會失去競爭力。好處在于，大廠通常建立了成熟的生態(tài)系統(tǒng)，擁有豐富的計算資源，可以相對容易地進行大模型投資。

第二類是創(chuàng)業(yè)公司，比較靈活，沒有大廠的包袱，決策速度快，但是他們需要長期投入大量的計算資源和精力，來開發(fā)大模型的相關(guān)業(yè)務(wù)，而投資人需要有足夠的耐心和信心等待收益，這可能是個劣勢。

第三類是傳統(tǒng)業(yè)務(wù)廠商，已有成熟的業(yè)務(wù)和穩(wěn)定的客戶，只需要通過接入大型模型，來更新他們的服務(wù)能力，以更好地服務(wù)客戶并增加收入，缺點是這類企業(yè)可能沒有足夠的人工智能技術(shù)人才和計算資源，用以投入到新技術(shù)開發(fā)中。

劉興亮：中國在大模型業(yè)務(wù)上，有哪些優(yōu)勢，又有哪些難點？

聶再清：優(yōu)勢有很多。首先是人才，特別是計算機領(lǐng)域，相關(guān)人才的數(shù)學、計算機技能普遍很好，尤其是人工智能領(lǐng)域，人才更是不缺。此外，有廣闊的市場和需求。

劣勢在于，ChatGPT并非出自中國，部分資料并不掌握，需要花更多時間去探索和研究。此外，是否會有一些投資機構(gòu)或資源方愿意長期地投入大量資源到創(chuàng)新領(lǐng)域，尤其在短期內(nèi)看不到商業(yè)效益也愿意持續(xù)大額投入？

沒有幾個國家的投資機構(gòu)能夠?qū)⒋罅康馁Y金投入到短期看起來毫無商業(yè)價值的無用研究中，然而這些看似無用的研究，往往是非常關(guān)鍵的基礎(chǔ)創(chuàng)新技術(shù)的來源。

劉興亮: 當前大模型的形式主要還是聊天機器人，這并不新鮮，為什么今天的產(chǎn)品會讓大家這么吃驚？

聶再清：對話引擎，從傳統(tǒng)的角度來看，它可以被分為兩類。

第一類是開放式的閑聊，用戶可以隨意交流，用戶說一句話，機器人回答一句話，這種對話對（QA pair）數(shù)據(jù)可以從積累的海量對話數(shù)據(jù)庫中獲取，也可以AI自動生成，機器回復通常信息量比較少，這樣可減少回復錯誤（言多必失）。

另一種是任務(wù)型對話，也稱為任務(wù)完成型對話，這種對話是為了完成特定的任務(wù)，例如用戶要聽一首歌曲，需要先了解用戶想要聽的歌曲參數(shù)，例如歌曲名和歌手名，將這些信息連接到知識圖譜上，以便系統(tǒng)能夠獲取歌曲的ID，其次是進行個性化推薦，讓用戶繼續(xù)享受這個體驗。

現(xiàn)在隨著ChatGPT的出現(xiàn)，開放域任務(wù)也能夠?qū)崿F(xiàn)很高的理解精度，這是非常令人興奮的。

不過智能助手業(yè)務(wù)公司在封閉域任務(wù)完成和開放域之間，也應(yīng)嘗試做一些平衡，由于早期GPT的理解能力還有限，作為廠商也需要保證每句話都是正確的，不能傷害用戶。如果GPT因為不能很好的理解而出現(xiàn)錯誤，修復這類問題需要大量的投入。

大模型創(chuàng)業(yè)潮推動數(shù)字化轉(zhuǎn)型

劉興亮：目前大模型扎堆，會不會存在資源浪費的問題，是否會重現(xiàn)團購、共享單車這樣的并購、倒閉潮？

大廠大模型進展，圖源：晚點LatePost

聶再清：在開始階段時，大模型驚艷的能力對人們造成的沖擊太大，大家不可避免地都想去試一試，我認為這沒有問題。這樣做的好處在于，可以培養(yǎng)更多的人才。如果不這樣做，大家都沒有經(jīng)驗，也就不會訓練出一批人才。然而，總是會有資本沒有耐心等的，未來一定會進行動態(tài)調(diào)整。

假設(shè)，有60家公司都做通用大模型，那么后面40家公司就會有人融不到資，部分人就會加入到一個頭部，使頭部的資源更加強大。但是，目前階段還不會有太大浪費的問題，最終（新產(chǎn)業(yè)）培養(yǎng)出的人才和經(jīng)驗，將集中在頭部公司?，F(xiàn)階段并購潮不太可能，早期應(yīng)該大部分公司現(xiàn)在還只是小規(guī)模試驗而已。

劉興亮：從應(yīng)用的層面來看，未來大模型會在哪些業(yè)帶來重大改變，有哪些創(chuàng)業(yè)機會，對創(chuàng)業(yè)者有什么建議？

聶再清：我認為創(chuàng)業(yè)有很多機會。

其中一類機會是基于大模型的應(yīng)用。每個行業(yè)都可以借助大模型來實現(xiàn)數(shù)字化，實現(xiàn)業(yè)務(wù)的最佳效果，但不是所有企業(yè)都有資源投入大模型研發(fā)，需要產(chǎn)業(yè)相關(guān)的大模型技術(shù)服務(wù)公司來幫助這些企業(yè)加入到大模型浪潮。

另外一類機會是在垂直行業(yè)中推出大模型的公司，這些行業(yè)只有具備了解特定數(shù)據(jù)和業(yè)務(wù)，才需要打造行業(yè)內(nèi)部的垂直大模型。例如，生命科學領(lǐng)域就有很多這樣的任務(wù)，因為它擁有許多細分數(shù)據(jù)，這些數(shù)據(jù)又需要具備行業(yè)知識。

第三類機會是基于大模型開發(fā)新產(chǎn)品、插件，這可能涉及硬件和傳統(tǒng)軟件等等，這種產(chǎn)品將提供全新的用戶體驗。

總之，大型模型將會帶來很多機會，核心則是利用其推動數(shù)字化轉(zhuǎn)型。

劉興亮：普通人在這樣的背景下能做什么？

聶再清：普通用戶，需要盡快掌握大模型產(chǎn)品、工具的使用，比如英文寫作，利用其提高工作效率。

風險在于隱私安全，大模型應(yīng)當擔責

劉興亮：大模型產(chǎn)品落地過程中，出現(xiàn)了眾多負面討論，馬斯克也呼吁暫停開發(fā)，人們的擔憂可能是什么？

聶再清：我認為這種技術(shù)可能存在以下幾種潛在的風險。

一種風險是有可能對社會或用戶構(gòu)成一定程度的干擾。因為即使技術(shù)非常強大，但也不能保證每句話都是正確的，潛在的風險就是可能會刺激到一些精神比較脆弱的用戶，或者會挑起種族矛盾，甚至會存在機密信息泄露等國家安全方面的風險。

另一個可能的風險是用戶隱私、客戶數(shù)據(jù)的泄露，這些平臺是否能夠采取措施，來防止這種情況發(fā)生，是否都已經(jīng)做好了必要的檢查，這是需要回答的問題。

另外，這種技術(shù)可能會對教育產(chǎn)生重大影響，特別是對孩子的教育，因為這項技術(shù)可以提供大量知識，未來的教育如何利用好大模型？有了大模型我們的知識教育方式是否需要調(diào)整？如果沒有認真思考過這些問題，可能會對下一代的教育造成負面影響。

當然，我認為現(xiàn)階段還沒必要過度擔憂，大模型技術(shù)總體來看還是安全可控的。

劉興亮：大模型在不斷進化過程中，會出現(xiàn)很多事實性錯誤，如果用戶過度依賴而造成負面影響，誰來擔責任，應(yīng)如何治理？

聶再清：大型模型是一個產(chǎn)品和工具，而只要是產(chǎn)品和工具，提供方應(yīng)該承擔責任。當然，也需要監(jiān)管部門幫助建立、完善創(chuàng)新機制和環(huán)境，既要鼓勵積極的創(chuàng)新，又要限制有害創(chuàng)新，尤其是對于大模型，安全和可控是前提條件。

劉興亮：可能什么樣的情況下，人類會暫停AI產(chǎn)品開發(fā)？

聶再清：我認為停止所有AI或大模型產(chǎn)品的開發(fā)是不太可能的，但如果這些技術(shù)或產(chǎn)品對客戶/用戶造成了傷害或風險，監(jiān)管部門可以要求停止使用具體的某項技術(shù)或產(chǎn)品，并進行檢查和整改。必須通過流程和機制，確保每一個產(chǎn)品都是安全的。

劉興亮：在特定領(lǐng)域，比如生物醫(yī)藥大模型，有沒有可能受商業(yè)利益驅(qū)使推薦藥品，這種情況可能會出現(xiàn)嗎？

聶再清：對于我們的生物醫(yī)藥大模型BioMedGPT，核心是幫助設(shè)計新藥，而不是現(xiàn)有藥品銷售。當然，未來有有可能向醫(yī)生提供藥品推薦的服務(wù)，但最終要由醫(yī)生做決策。

此外，大模型可以向醫(yī)生提供疾病的病因和治療建議，提供相應(yīng)的數(shù)據(jù)參考，進而輔助醫(yī)療效率提升，在這方面的應(yīng)用空間也很大。

免責聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個人觀點，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請自行核實相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

中國大模型優(yōu)勢是人才和市場，暫時不會出現(xiàn)倒閉潮丨亮見26期

下一篇

中國大模型優(yōu)勢是人才和市場，暫時不會出現(xiàn)倒閉潮丨亮見26期

下一篇

中國大模型優(yōu)勢是人才和市場，暫時不會出現(xiàn)倒閉潮丨亮見26期