鯤鵬DevKit助力軒轅AI科學(xué)計算平臺DataLab原生開發(fā),性能提升89%

什么是科學(xué)計算平臺?

科學(xué)研究是人們探索新事物、認(rèn)知新規(guī)律、創(chuàng)造新技術(shù)的重要途徑,隨著人類社會的不斷進步,今天科學(xué)研究已經(jīng)前進到一個更加復(fù)雜深奧的世界,研究的對象也向著大范圍、多領(lǐng)域的復(fù)雜系統(tǒng)工程進軍。例如,航天工程、全球氣候、生態(tài)環(huán)境問題等,對科研方法和手段也提出了新的挑戰(zhàn)。

科學(xué)計算作為現(xiàn)代科研主要手段,廣泛應(yīng)用于信息檢索、環(huán)境模擬、數(shù)值計算、數(shù)據(jù)分析等場景中,同時,機器學(xué)習(xí)的迅猛發(fā)展也推動著科學(xué)計算平臺進入了百家爭鳴的時代:各類統(tǒng)計軟件、數(shù)據(jù)分析軟件、仿真軟件、制圖軟件多如牛毛……然而這種傳統(tǒng)的、分散的科研方式,給科研工作帶來了巨大挑戰(zhàn):

· 知識碎片化、孤島化,難以建立起關(guān)聯(lián)關(guān)系;

· AI模型搭建對編程技能要求高,時間成本巨大且后期訓(xùn)練優(yōu)化費時費力;

· 人工處理復(fù)雜建模操作,效率低,高維方程求解難度大,精度和性能無法兼顧;

· 大量機器學(xué)習(xí)訓(xùn)練數(shù)據(jù)的采集、清洗和治理工作繁瑣而枯燥;深度學(xué)習(xí)框架缺乏租戶功能,難以實現(xiàn)資源的有效隔離和集群算力的有效管理。

工欲善其事,必先利其器。為了快速、實時的分析海量科學(xué)數(shù)據(jù)背后的意義、最大限度地滿足科研機構(gòu)和人員之間交流與協(xié)作的需要,基于現(xiàn)代信息技術(shù)的科研平臺對于提高科研水平、促進學(xué)科交叉和融合、加強高層次創(chuàng)新人才的培養(yǎng)起著至關(guān)重要的作用。

軒轅研究院:

聯(lián)合鯤鵬打造AI科學(xué)計算平臺DataLab

軒轅研究院

是軒轅網(wǎng)絡(luò)旗下的全資子公司,是圍繞人工智能的科研和實訓(xùn)教學(xué)的新型研發(fā)機構(gòu),深耕教育行業(yè)23年,是國內(nèi)領(lǐng)先的AI+產(chǎn)教融合服務(wù)商。該機構(gòu)依托多年的高校的技術(shù)成果,以及豐富的產(chǎn)學(xué)研合作方式,將國內(nèi)外先進的技術(shù)成果轉(zhuǎn)化為科研應(yīng)用技術(shù)和產(chǎn)品,助力科學(xué)技術(shù)的研究和創(chuàng)新。

軒轅AI科學(xué)計算平臺DataLab是軒轅研究院聯(lián)合廣州“鯤鵬+昇騰”生態(tài)創(chuàng)新中心共同打造的輔助科研工作的一體化解決方案。該方案集鯤鵬算力、多領(lǐng)域科研樣本數(shù)據(jù)、算法模型研發(fā)以及管理工具于一身,能有效支撐機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、知識抽取、關(guān)聯(lián)規(guī)律、智能預(yù)測、決策推理和高清科研圖表輸出等任務(wù)??捎糜谧匀豢茖W(xué)與社會科學(xué)研究,以及計算機、軟件、電子、自動化相關(guān)科研團隊進行計算機技術(shù)原理性的驗證場景,基于算法、數(shù)據(jù)進行科研實驗,并形成圖形化界面呈現(xiàn)實驗結(jié)果,攻關(guān)技術(shù)難題項目,助力科技成果轉(zhuǎn)化和推廣。

【軒轅AI科學(xué)計算平臺DataLab解決方案架構(gòu)】

伴隨著科研數(shù)據(jù)持續(xù)爆炸性增長,科學(xué)家們需要更高的計算效率、數(shù)據(jù)處理效率以及工程效率,從而更好地支撐跨領(lǐng)域科研,這也對IT平臺的算力提出了更高挑戰(zhàn)。

· 鯤鵬天然的多核多并發(fā)、高性能、高算力以及低功耗等優(yōu)勢,能夠很好的滿足科研平臺海量數(shù)據(jù)處理、并行計算、低時延、綠色計算等要求;

· 作為軒轅研究院AI科學(xué)計算平臺DataLab的算力底座,鯤鵬還提供完善的鯤鵬DevKit開發(fā)套件以及專業(yè)服務(wù),能夠幫助用戶快速完成應(yīng)用的遷移、開發(fā)、編譯和調(diào)優(yōu),支撐科研平臺的高效創(chuàng)新。

鯤鵬DevKit 1人天/應(yīng)用

快速遷移AI科學(xué)計算平臺

在項目實施初期,開發(fā)人員需要將DataLab平臺快速遷移到鯤鵬。由于整個系統(tǒng)的模塊眾多給遷移工作帶來不少挑戰(zhàn):

· 代碼量大:5個子模塊\15個微服務(wù),共計100萬行左右代碼;

· 第三方軟件多:包含redis、rabbitmq、nacos、datax、hadoop,500+JAR包,手工查找兼容版本非常耗時;

經(jīng)分析,采用手動遷移的話整個系統(tǒng)15個微服務(wù)需要30人天才能完成。

而鯤鵬DevKit代碼遷移工具可以實現(xiàn)依賴文件自動識別、兼容JAR包一鍵下載、代碼修改建議一鍵替換,無須耗時耗力檢查跟進。在鯤鵬DevKit的幫助下整個系統(tǒng)只用了10人天,平均每個服務(wù)不到1人天即可完成自動遷移。

【使用鯤鵬DevKit代碼遷移工具進行代碼分析】

基于鯤鵬DevKit高效開發(fā)建筑違章檢測算法模型,性能提升89%

遷移完成之后,軒轅研究院需要針對DataLab平臺中GIS領(lǐng)域科研場景,在鯤鵬平臺上新開發(fā)建筑違章檢測算法模型。在開發(fā)過程中,為進一步提升業(yè)務(wù)性能和穩(wěn)定性,將平臺之前使用的OpenJDK換成畢昇JDK,畢昇JDK在鯤鵬架構(gòu)中提供了更好的版本穩(wěn)定性、GC(Gabarage Collector)性能、加解密性能,能夠提升DataLab平臺數(shù)據(jù)處理應(yīng)用的運行效率。

此外,針對系統(tǒng)出現(xiàn)的性能瓶頸,軒轅研究院的技術(shù)人員使用了鯤鵬性能分析工具進行了調(diào)優(yōu),對操作系統(tǒng)、JVM的運行狀態(tài)進行了分析和優(yōu)化,提升DataLab平臺AI計算模型相關(guān)業(yè)務(wù)的運行效率:

在系統(tǒng)性能分析中創(chuàng)建系統(tǒng)全景分析任務(wù)

通過采集系統(tǒng)軟硬件配置信息,以及系統(tǒng)CPU、內(nèi)存、存儲IO、網(wǎng)絡(luò)IO資源的運行情況,識別出CPU單次利用率高和兩處熱點函數(shù)占比較大的瓶頸,并給出了優(yōu)化建議 ,解決了DataLab平臺93093線程的38-CPU單次利用率高的問題,提高了平臺運行性能。

【AI科學(xué)計算平臺DataLab系統(tǒng)性能調(diào)優(yōu)-全景分析】

通過訪存分析功能高階分析能力

分析到應(yīng)用存在跨片跨DIE的內(nèi)存訪問,并在系統(tǒng)建議下進行了進程綁核,從而優(yōu)化各個微服務(wù)的硬件資源分配,提升計算資源利用率。

通過微架構(gòu)分析對DataLab平臺的操作系統(tǒng)進行采樣分析

發(fā)現(xiàn)了badSpeculation的branchMispredic占比較高,以及代碼中for循環(huán)嵌套的if判斷存在大量分支預(yù)測響應(yīng)失敗情況,并針對上述問題給出了優(yōu)化建議,對平臺程序響應(yīng)時間、內(nèi)存分配等方面進行了性能優(yōu)化。

通過Java性能分析

對平臺的Java方法采樣、線程轉(zhuǎn)儲、老年代對象采樣等多種采樣分析方式,經(jīng)過調(diào)整垃圾回收器的配置策略,改善查詢業(yè)務(wù)的吞吐量;

通過上述一系列的優(yōu)化分析,軒轅研究院DataLab平臺在鯤鵬上運行性能得到有效提升:比如對比鯤鵬DevKit優(yōu)化前后,模型查詢業(yè)務(wù)的平均響應(yīng)時間典型場景下(1分鐘200并發(fā))縮短27%,極限壓測場景下(1分鐘10000并發(fā))縮短89%;

【模型查詢業(yè)務(wù)平均響應(yīng)時間對比】

模型查詢業(yè)務(wù)的吞吐量在鯤鵬DevKit優(yōu)化后也整體提升了30%。

【模型查詢業(yè)務(wù)吞吐量對比】

此外,數(shù)據(jù)集檢索、數(shù)據(jù)集上傳、模型訓(xùn)練等業(yè)務(wù)的綜合性能均得到明顯提升。軒轅研究院在進行鯤鵬原生開發(fā)過程中,通過鯤鵬DevKit優(yōu)化了DataLab平臺數(shù)據(jù)處理能力,有效提升了違章建筑檢測的查詢速度,同時也讓GIS領(lǐng)域的科研工作更加便捷和高效。

軒轅研究院的AI科學(xué)計算平臺DataLab能夠在地理遙感、生物醫(yī)藥、地球科學(xué)、工業(yè)互聯(lián)網(wǎng)以及社會科學(xué)等眾多領(lǐng)域發(fā)揮重要作用,該方案已經(jīng)在2021年鯤鵬應(yīng)用創(chuàng)新大賽廣東賽區(qū)斬獲了金獎,成為2022年科研領(lǐng)域唯一入選鯤鵬精選解決方案。作為鯤鵬計算產(chǎn)業(yè)生態(tài)重要伙伴,軒轅研究院也與廣州“鯤鵬+昇騰”生態(tài)創(chuàng)新中心建立了長期合作關(guān)系,后續(xù)也將持續(xù)基于鯤鵬原生開發(fā)實現(xiàn)科學(xué)計算領(lǐng)域的應(yīng)用創(chuàng)新。

鯤鵬原生開發(fā)是指使用鯤鵬DevKit的原生開發(fā)能力,如鯤鵬開發(fā)框架(含場景化SDK)、編譯調(diào)試工具、云測服務(wù)、調(diào)優(yōu)&診斷工具等,在鯤鵬平臺上開發(fā)新軟件/新功能,充分發(fā)揮鯤鵬架構(gòu)優(yōu)勢,從而獲得開發(fā)效率/運行性能提升。

未來,鯤鵬DevKit將持續(xù)增強開發(fā)體驗、優(yōu)化工具能力,提升鯤鵬開發(fā)效率,促進千行百業(yè)數(shù)字化轉(zhuǎn)型。

【掃碼登錄鯤鵬社區(qū)DevKit專區(qū),了解更多】

 

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2022-06-29
鯤鵬DevKit助力軒轅AI科學(xué)計算平臺DataLab原生開發(fā),性能提升89%
什么是科學(xué)計算平臺?科學(xué)研究是人們探索新事物、認(rèn)知新規(guī)律、創(chuàng)造新技術(shù)的重要途徑,隨著人類社會的不斷進步,今天科學(xué)研究已經(jīng)前進到一個更加復(fù)雜深奧的世界,研究的對象也向著大范圍、多領(lǐng)域的復(fù)雜系統(tǒng)工程進軍。例如,航天工程、全球氣候、生態(tài)環(huán)境問題等,對科研方法和手段也提...

長按掃碼 閱讀全文