9月25日,由中國(guó)信息通信研究院云大計(jì)算與大數(shù)據(jù)研究所和人工智能關(guān)鍵技術(shù)和應(yīng)用評(píng)測(cè)工業(yè)和信息化部重點(diǎn)實(shí)驗(yàn)室聯(lián)合主辦的「2023大模型工程化論壇」在北京成功舉辦。aiXcoder(硅心科技)作為AIGC for Code領(lǐng)域的頭部廠商受邀參會(huì)?;谠诖a大模型、企業(yè)應(yīng)用落地等方面的技術(shù)積累和服務(wù)能力,aiXcoder成為信通院首批AI4SE工作組成員單位,共同推動(dòng)AI賦能軟件工程生態(tài)建設(shè),促進(jìn)產(chǎn)業(yè)健康有序發(fā)展。
會(huì)上,aiXcoder聯(lián)合創(chuàng)始人兼首席科學(xué)家謝濤教授受邀出席并發(fā)表「基于大模型的智能化軟件工程:機(jī)會(huì)與挑戰(zhàn)」主題演講,介紹了智能化軟件工程的發(fā)展歷程,基于大模型的代碼生成的興起、應(yīng)用和挑戰(zhàn),以及aiXcoder 近來(lái)的進(jìn)展。
aiXcoder聯(lián)合創(chuàng)始人兼首席科學(xué)家 謝濤教授 發(fā)表主題演講
aiXcoder成為AI4SE工作組首批成員單位
AI4SE(AI for Software Engineering),是指以大模型等AI技術(shù)為驅(qū)動(dòng)的,以提高軟件研發(fā)運(yùn)營(yíng)智能化水平為導(dǎo)向的,以提質(zhì)增效為目標(biāo)的,新一代智能化軟件工程。
AI4SE工作組首批成員單位名單
AI4SE工作組以“中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟”和“人工智能關(guān)鍵技術(shù)和應(yīng)用評(píng)測(cè)工業(yè)和信息化部重點(diǎn)實(shí)驗(yàn)室”為依托,凝聚人工智能行業(yè)和軟件工程行業(yè)優(yōu)秀企業(yè)和專家,發(fā)揮生成式AI、大模型等人工智能技術(shù)在軟件工程領(lǐng)域的潛力,推動(dòng)AI賦能軟件工程生態(tài)建設(shè)。
工作組成立后,aiXcoder將與各方共同探討和研究AI賦能軟件工程的現(xiàn)狀、方法和問(wèn)題,制定AI4SE相關(guān)標(biāo)準(zhǔn)和實(shí)踐指南,發(fā)布相關(guān)行業(yè)報(bào)告、典型案例等成果,梳理和分析產(chǎn)業(yè)落地經(jīng)驗(yàn),為技術(shù)提供方和應(yīng)用方搭建溝通交流平臺(tái),助力企業(yè)軟件開(kāi)發(fā)智能化水平的迅速提升。
中國(guó)信通院云大所人工智能部主任曹峰表示,伴隨著以GPT-4為首的新一代高性能大模型的出現(xiàn),大模型多維度能力提升有望成為新一代軟件工程的技術(shù)底座;AI和軟件工程的發(fā)展走向融合,軟件工程邁入智能化時(shí)代。以大模型為引擎的智能化能力,使軟件開(kāi)發(fā)工具,向多功能多語(yǔ)言工具方向發(fā)展;局部效能提升能力備受青睞,企業(yè)研發(fā)部門(mén)找到了DevOps時(shí)代的新增長(zhǎng)點(diǎn)。
據(jù)悉,首批成員單位涉及高校院所、金融、運(yùn)營(yíng)商、互聯(lián)網(wǎng)大廠、軟件服務(wù)業(yè)等多個(gè)行業(yè)。
基于大模型的智能化軟件工程:
機(jī)會(huì)與挑戰(zhàn)
謝濤表示,在經(jīng)歷面向過(guò)程、面向?qū)ο?、面向?gòu)件的開(kāi)發(fā)范式后,“面向智構(gòu)件(Intelligently Constructed Components 智能化創(chuàng)建)的開(kāi)發(fā),是軟件開(kāi)發(fā)提質(zhì)增效未來(lái)方向”。通過(guò)「抽象」屏蔽復(fù)雜性、保證質(zhì)量,通過(guò)「復(fù)用」和「智能化創(chuàng)建」降低成本、提升效率。
aiXcoder基于代碼大模型的智能化軟件開(kāi)發(fā)系統(tǒng),已擁有代碼自動(dòng)補(bǔ)全、代碼自動(dòng)生成、單元測(cè)試待自動(dòng)生成、代碼缺陷檢測(cè)與修復(fù)、代碼注釋自動(dòng)生成、代碼解釋以及智能代碼搜索等智能化開(kāi)發(fā)能力,可覆蓋更多開(kāi)發(fā)場(chǎng)景。
代碼大模型在落地企業(yè)時(shí)也面臨諸多挑戰(zhàn),目前國(guó)內(nèi)絕大部分企業(yè)和研發(fā)機(jī)構(gòu)的開(kāi)發(fā)環(huán)境無(wú)法訪問(wèn)外網(wǎng),對(duì)企業(yè)數(shù)據(jù)和代碼的安全要求很高。同時(shí),企業(yè)的計(jì)算資源有限,如何在廣泛部署的時(shí)候做到成本可控?企業(yè)內(nèi)部的庫(kù)和框架等企業(yè)領(lǐng)域知識(shí),如何與大模型相結(jié)合,提升代碼質(zhì)量和開(kāi)發(fā)效率?這些均是企業(yè)在實(shí)際應(yīng)用大模型時(shí)需要考慮的問(wèn)題。
針對(duì)以上挑戰(zhàn),aiXcoder已經(jīng)形成了一套企業(yè)適配的智能化軟件開(kāi)發(fā)解決方案:
•aiXcoder支持企業(yè)私有化部署+代碼大模型個(gè)性化訓(xùn)練
aiXcoder可以根據(jù)企業(yè)數(shù)據(jù)安全及合規(guī)要求、結(jié)合現(xiàn)有算力資源,將訓(xùn)練完善的代碼大模型私有化部署在企業(yè)本地,確保企業(yè)代碼資產(chǎn)安全,支持公有云、私有云、IDC、自建機(jī)房等多種部署環(huán)境,可根據(jù)企業(yè)業(yè)務(wù)量級(jí)靈活擴(kuò)展模型規(guī)模。企業(yè)依托常規(guī)算力即可滿足日常編碼需求,大幅度降低了企業(yè)應(yīng)用代碼大模型的算力硬件門(mén)檻,推進(jìn)智能化軟件開(kāi)發(fā)技術(shù)普適化進(jìn)程。
在私有化部署基礎(chǔ)上,aiXcoder可根據(jù)企業(yè)研發(fā)需要,基于企業(yè)領(lǐng)域代碼提供代碼大模型個(gè)性化訓(xùn)練服務(wù)。在保證主干模型的推理能力不受影響的情況下,通過(guò)修改模型結(jié)構(gòu)與預(yù)測(cè)方式,以較小的微調(diào)參數(shù),在企業(yè)私域數(shù)據(jù)上獲得更好效果;使得模型生成的代碼更符合企業(yè)自身的業(yè)務(wù)邏輯和代碼規(guī)范,進(jìn)一步提高代碼生成效率和準(zhǔn)確率。
除此之外,aiXcoder還為企業(yè)提供數(shù)據(jù)統(tǒng)計(jì)與分析、開(kāi)發(fā)人員權(quán)限管理、企業(yè)定制開(kāi)發(fā)等應(yīng)用和服務(wù),幫助企業(yè)在數(shù)字化時(shí)代的業(yè)務(wù)創(chuàng)新和智能化轉(zhuǎn)型中取得競(jìng)爭(zhēng)優(yōu)勢(shì)。
在談到代碼大模型的未來(lái)發(fā)展時(shí),謝濤表示有以下幾點(diǎn)值得大家關(guān)注:
一是代碼大模型的能力提升方面,程序語(yǔ)言和自然語(yǔ)言有很大不同,如何針對(duì)代碼特性設(shè)計(jì)模型結(jié)構(gòu)和訓(xùn)練方式是值得探索和推進(jìn)的方向。只將靜態(tài)代碼輸入給大模型會(huì)由于輸入信息量不足而導(dǎo)致大模型對(duì)程序的理解不夠,如何構(gòu)造讓模型更容易學(xué)習(xí)和理解的輸入數(shù)據(jù),比如增加動(dòng)態(tài)執(zhí)行信息,通過(guò)程序語(yǔ)義等價(jià)性生成額外的等價(jià)程序,會(huì)有助于大模型做到程序理解。
二是代碼大模型下游任務(wù)的生態(tài)建設(shè),包括測(cè)試、調(diào)試等更多下游任務(wù)及應(yīng)用細(xì)分領(lǐng)域的拓展,輔助解決更多的工程任務(wù);以及更多支撐下游任務(wù)的工具鏈,包括需求分解、測(cè)試用例生成、調(diào)試/修復(fù)等工具,以更好地支撐智能化軟件工程任務(wù)。
最后,我們也需要關(guān)注代碼大模型時(shí)代的工程師教育和培訓(xùn),讓他們更好的扮演“監(jiān)督”的角色,具備更強(qiáng)的理解程序、判定程序的能力。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )