硬核AI技術疊加無限創(chuàng)意,百度文心大模型產業(yè)落地加速

隨著數據的井噴、算法的進步和算力的突破,效果好、泛化能力強、通用性強的預訓練大模型(以下簡稱“大模型”)已成為人工智能發(fā)展的新方向。4月16日,2021百度認知AI創(chuàng)意賽“AI創(chuàng)意派”決賽正式舉行,這是業(yè)內首次將先進的AI大模型能力開放給公眾使用,實現了大模型在激發(fā)創(chuàng)意、落地應用上的突破。文心大模型首場技術開放日也同期舉行,文心大模型背后的“技術天團”首次集中亮相,解讀大模型無限創(chuàng)意背后的硬核AI技術。

大模型助力創(chuàng)意應用,為創(chuàng)意插上騰飛羽翼

元宇宙虛擬人生、AI版“反詐App”、續(xù)寫一本小說、神奇植物都有啥……這些趣味DEMO和落地方案,均是由AI創(chuàng)意派參賽選手基于百度飛槳文心大模型開發(fā)創(chuàng)造的。據統(tǒng)計,本次AI創(chuàng)意賽共吸引全國各地近2000名不同年齡、不同技術基礎的選手參與其中,收集超過300份創(chuàng)意方案,作品覆蓋教育、醫(yī)療、金融、娛樂、科技、心理健康等多個領域。最終,開發(fā)創(chuàng)意組9組選手脫穎而出闖入決賽,最終“說文”、“圖言”、“AI起論文標題”等項目摘得大獎。

百度集團副總裁吳甜在比賽現場表示,“創(chuàng)意在民間。人工智能和大模型要面向公眾開放,只有門檻低到了所有人都可方便地用起來,才能真正大規(guī)模爆發(fā)出各種創(chuàng)意。這是文心大模型的努力方向。文心源于產業(yè)實踐,也將在產業(yè)中廣泛落地。本次創(chuàng)意賽中,選手展現了基于文心大模型的豐富創(chuàng)意,讓我們看到了大模型廣泛應用的前景?!?/p>

本次創(chuàng)意賽邀請了中國國家博物館、國博(北京)文化產業(yè)發(fā)展中心創(chuàng)意設計部總監(jiān)白藕,天津大學北洋講席教授、智能與計算學部副主任兼人工智能學院院長胡清華,哈爾濱工業(yè)大學計算機科學與技術學院人工智能專業(yè)負責人張宇,南方科技大學科學與人類想象力研究中心主任吳巖,線性資本董事總經理黃松延,百度技術委員會主席吳華,百度飛槳總架構師于佃海,百度高校合作部總監(jiān)李軒涯等來自產業(yè)、學術以及投資方等各界嘉賓作為評委專家,對參賽項目做出了精彩的點評。多位評委專家表示,大模型是目前AI行業(yè)發(fā)展的新趨勢。通過本次創(chuàng)意賽,挖掘了多支具備開發(fā)和創(chuàng)意雙重實力的參賽隊伍,豐富了大模型落地的想象空間。

獲得本次AI創(chuàng)意賽冠軍“頂尖派”的參賽項目“說文”的代表卓君表示,百度飛槳開放了ERNIE 3.0知識增強大模型能力,不僅讓我們體會到了大模型的真正實力,也讓每一位對AI感興趣的人都可以充分發(fā)揮創(chuàng)造力,去實現關于文字、語言的創(chuàng)意想法。

自2019年,百度便深耕大模型研發(fā)并成功打造文心大模型家族。目前,文心大模型已成為產業(yè)級知識增強大模型,包含NLP(自然語言理解)大模型、CV(計算機視覺)大模型、跨模態(tài)大模型,既有基礎通用的大模型,也包含面向重點領域、重點任務的大模型,以及豐富的工具與平臺。

與行業(yè)其他大模型相比,文心大模型具備“知識增強”的核心特色。文心大模型基于大規(guī)模知識和海量無結構數據的融合深度學習,不斷吸收文本數據中詞匯、結構、語義等方面的知識,使得文心大模型的理解能力和生成能力不斷進化提升,并面向不同人群提供豐富的工具組件及平臺,助力各行各業(yè)的創(chuàng)意應用。

以此次創(chuàng)意賽所使用的ERNIE 3.0為例,作為NLP大模型中的一員,不僅擁有很強的語言理解能力,還能夠實現視頻、歌詞、藝術畫等創(chuàng)意作品的自動生成,用AI為創(chuàng)意插上騰飛羽翼。尤其是在AIGC(AI generated content,人工智能創(chuàng)造內容)領域,借助大模型的跨模態(tài)綜合技術能力,可以激發(fā)創(chuàng)意,提升內容多樣性,降低制作成本,實現大規(guī)模應用。如在本次AI創(chuàng)意賽中,就涌現了像傳記生成、高考志愿推薦、心理樹洞等諸多創(chuàng)意應用。

吳甜還演示了近期在海外引發(fā)關注的“虎年春晚上的中國文化”視頻,該視頻由百度研究院的智能視頻合成平臺VidPress自動生成,背后就使用了文心大模型的文本摘要、語義分析和跨模態(tài)理解等多項技術,打開了AIGC智能創(chuàng)作想象空間。

在現場的大模型互動區(qū),觀眾也可以親身體驗到大模型在歌詞生成、畫作生成和對話機器人等應用,同時文創(chuàng)集市上也展現了基于大模型能力生成的T恤、馬克杯、帆布袋、畫冊、明信片等創(chuàng)意周邊,切身感受大模型在創(chuàng)意領域的落地應用。

深耕產業(yè)級大模型,文心大模型實現技術、落地雙領先

作為國內最早開始進行大模型研發(fā)的科技企業(yè)之一,百度在2019年3月率先發(fā)布中國首個正式開放的預訓練模型ERNIE1.0,并持續(xù)投入于大模型的研發(fā)升級。2021年12月,ERNIE 3.0升級為全球首個知識增強千億大模型,成為目前為止全球最大的中文單體模型,在60多項權威的自然語言理解和生成任務上取得了世界領先效果。

目前,文心系列模型中已有多個大模型達到世界領先水平。例如,百度打造了全球首個百億參數中英文對話大模型PLATO-XL,首個聚焦中英文場景大規(guī)模OCR結構化預訓練模型VIMER - StrucTexT,全球最大規(guī)模中文跨模態(tài)生成模型ERNIE-ViLG等。

超大規(guī)模模型的訓練和推理,給深度學習框架帶來很大考驗。在文心大模型的背后,我國首個自主研發(fā)、功能豐富、開源開放的產業(yè)級深度學習平臺飛槳提供了有力支撐。飛槳研制了端到端自適應分布式訓練框架,實現多硬件支持,并行效率高達90%,有效支持文心大模型高效、穩(wěn)定訓練?;陲w槳與百舸集群,文心大模型在算法、框架、算力層面實現完全自主技術創(chuàng)新,為中國產業(yè)智能化轉型打造AI大底座。

除了技術上的不斷創(chuàng)新,文心大模型作為“產業(yè)級”大模型,驅動AI規(guī)?;涞貞檬瞧浜诵膬r值。截至目前,文心大模型已支持數百家企業(yè)與機構,開發(fā)者數量超過6萬,已在數百個場景中落地應用,產業(yè)應用數量居業(yè)界首位。

據吳甜介紹,文心大模型已大規(guī)模應用于百度內部的各類產品,包含搜索、信息流、小度智能屏、百度地圖等,顯著提升了產品智能化體驗。基于文心的開放能力,對外的日調量超過了五千萬次。文心大模型現已通過飛槳平臺、百度智能云賦能工業(yè)、能源、金融、通信、媒體、教育等各行各業(yè)。

除了AI創(chuàng)意派的決賽活動,4月16日上午,百度還舉辦了首場文心大模型技術開放日,文心大模型背后的“技術天團”首次集中亮相,百度技術委員會主席吳華,百度計算機視覺首席科學家王井東,百度飛槳總架構師于佃海,百度杰出研發(fā)架構師孫宇分享了大模型技術發(fā)展趨勢洞察、文心大模型最新技術突破及產業(yè)應用實踐,為技術愛好者帶來一場干貨滿滿的AI技術盛宴。

從AI核心技術到AI基礎平臺,堅持技術創(chuàng)新及開放生態(tài),百度文心大模型正不斷降低AI技術開發(fā)和應用的門檻,保持技術迭代和創(chuàng)新突破,更強有力地支撐人工智能技術的高速發(fā)展及產業(yè)應用。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2022-04-17
硬核AI技術疊加無限創(chuàng)意,百度文心大模型產業(yè)落地加速
4月16日,2021百度認知AI創(chuàng)意賽“AI創(chuàng)意派”決賽正式舉行,這是業(yè)內首次將先進的AI大模型能力開放給公眾使用,實現了大模型在激發(fā)創(chuàng)意、落地應用上的突破。

長按掃碼 閱讀全文