學(xué)習(xí)曲線4:更精進(jìn)的AI模型與不斷演進(jìn)的語(yǔ)言

移動(dòng)AI普及背后的故事——來(lái)自三星電子中國(guó)研究院的人們與創(chuàng)新

圖片1.jpg

在三星不斷創(chuàng)新,持續(xù)引領(lǐng)卓越移動(dòng)AI體驗(yàn)的背景下,我們拜訪了位于世界各地的三星電子研究院,力求探究Galaxy AI是如何助力用戶釋放無(wú)限潛能的。如今,Galaxy AI憑借已支持的16種語(yǔ)言,可以服務(wù)更多不同語(yǔ)種的用戶,即便是在離線狀態(tài)下,用戶也能利用基于端側(cè)AI的通話實(shí)時(shí)翻譯、翻譯助手、筆記助手和瀏覽助手等功能,跨越語(yǔ)言壁壘。那么,關(guān)于Galaxy AI語(yǔ)言翻譯的研發(fā),又有哪些背后的故事呢?上一期,我們拜訪了位于越南的三星電子研究院,了解了用于AI模型訓(xùn)練的數(shù)據(jù)是如何收集的。這一期,我們將走近中國(guó)團(tuán)隊(duì),看他們是如何為中國(guó)用戶們提供獨(dú)特的Galaxy AI體驗(yàn)的。

在全球范圍內(nèi),基于大語(yǔ)言模型(LLM)的AI工具正在飛速發(fā)展,中國(guó)也不例外。隨著百度 ERNIE Bot 和美圖 Miracle Vision的發(fā)展普及,三星電子中國(guó)研究院也選擇了與這兩家公司深入合作,共同打造屬于中國(guó)市場(chǎng)的Galaxy AI功能。

攜手不同AI合作伙伴,使得Galaxy AI在后端乃至底層技術(shù)的整合面臨了巨大的挑戰(zhàn),但三星電子中國(guó)研究院的北京和廣州團(tuán)隊(duì)必須在規(guī)定的時(shí)間內(nèi),讓中國(guó)用戶獲得與全球其他用戶相同的 Galaxy AI 體驗(yàn)。因此,他們利用第三方合作伙伴提供的中國(guó)方言專用資源,為中國(guó)用戶打造了獨(dú)一無(wú)二的 Galaxy AI 解決方案。

三星電子廣州研究院軟件創(chuàng)新團(tuán)隊(duì)負(fù)責(zé)人張海榕表示:“我們的優(yōu)勢(shì)在于能夠?qū)⑷蜃詈玫膶?shí)踐經(jīng)驗(yàn)與中國(guó)本土的實(shí)踐經(jīng)驗(yàn)相融合,并通過(guò)與中國(guó)用戶的日常交流了解用戶的需求,不斷改進(jìn)提升,開發(fā)新功能。我們的團(tuán)隊(duì)?wèi){借在Galaxy S24項(xiàng)目中積累的豐富開發(fā)經(jīng)驗(yàn),與百度、美圖等中國(guó)本土人工智能公司攜手合作,帶來(lái)了真正贏得用戶共鳴的解決方案,對(duì)此我深感自豪。”

圖片2.jpg

一開始,各團(tuán)隊(duì)都需要適應(yīng)彼此的工作方式,并解決項(xiàng)目初期信息不對(duì)等的問(wèn)題。對(duì)此,三星電子中國(guó)研究院院長(zhǎng)張代君成立了一個(gè)特別工作組,以確保項(xiàng)目能夠按照研發(fā)規(guī)劃快速地推進(jìn)并完成目標(biāo)。

圖片3.jpg

憑借北京團(tuán)隊(duì)在大模型生成方面的豐富經(jīng)驗(yàn),以及與第三方合作伙伴的成功合作,所有的生成式AI功能最終在中國(guó)成功問(wèn)世,為中國(guó)用戶帶來(lái)了更為本土化的具備特定市場(chǎng)功能(如“觸摸搜索”)的解決方案。

基于中文開發(fā)粵語(yǔ)方言模型

早在2024年1月Galaxy S24上市之際,Galaxy AI便已支持了普通話,但對(duì)于三星電子中國(guó)研究院而言,工作仍未結(jié)束。在此之后,中國(guó)團(tuán)隊(duì)投入到了支持粵語(yǔ)的AI模型研發(fā)工作中。該項(xiàng)研究將在普通話語(yǔ)言模型的基礎(chǔ)上,進(jìn)一步解決粵語(yǔ)語(yǔ)言特征所帶來(lái)一系列新問(wèn)題。

圖片4.jpg

在粵語(yǔ)AI語(yǔ)言模型的開發(fā)過(guò)程中,研發(fā)團(tuán)隊(duì)面臨的主要難題就是文化方面的差異。首先,中國(guó)香港的書寫和口語(yǔ)是兩套不同的系統(tǒng)。中國(guó)香港用戶在書寫時(shí)使用類似普通話的語(yǔ)法和表達(dá)方式,而在日常交流時(shí)則采用完全不同的口語(yǔ)語(yǔ)法。此外,粵語(yǔ)發(fā)音有九個(gè)聲調(diào),而普通話則有四個(gè)。

另一個(gè)文化差異則是粵語(yǔ)方言本身也在與時(shí)俱進(jìn),并且很多時(shí)候人們經(jīng)常會(huì)在對(duì)話中將粵語(yǔ)和英語(yǔ)混在一起用,因此,創(chuàng)建測(cè)試用例、驗(yàn)證語(yǔ)言包的復(fù)雜程度不言而喻。

圖片5.jpg

"粵語(yǔ)是一種非常獨(dú)特的方言,在不同的粵語(yǔ)地區(qū)會(huì)有不同的說(shuō)法,"負(fù)責(zé)粵語(yǔ)AI解決方案測(cè)試工作的李靖表示,"一些俚語(yǔ)、短語(yǔ)、詞匯甚至音調(diào)在不同地方都不盡相同。因此,我們對(duì)大量中國(guó)香港的詳細(xì)數(shù)據(jù)進(jìn)行了核對(duì),并校對(duì)了數(shù)以萬(wàn)計(jì)的相關(guān)測(cè)試案例。"

圖片6.jpg

考慮到這些復(fù)雜性,三星電子中國(guó)研究院的北京和廣州團(tuán)隊(duì)合作實(shí)現(xiàn)了在粵語(yǔ)和英語(yǔ)的混合語(yǔ)音識(shí)別中支持深層代碼混合、在機(jī)器翻譯中支持書面和口語(yǔ)表達(dá)、在語(yǔ)音合成中使用當(dāng)前的發(fā)音。

溝通中的文化影響

當(dāng)Galaxy AI的粵語(yǔ)語(yǔ)言包可供使用時(shí),消費(fèi)者的反饋很好地表明了三星研發(fā)團(tuán)隊(duì)的辛勤工作都是值得的。

三星Galaxy AI的項(xiàng)目經(jīng)驗(yàn)表明,不管是在中國(guó)大陸還是中國(guó)中國(guó)香港地區(qū),一個(gè)全球品牌不僅應(yīng)擁有專業(yè)的當(dāng)?shù)貓F(tuán)隊(duì)和相關(guān)的當(dāng)?shù)刂R(shí),還要具備與當(dāng)?shù)氐谌胶献骰锇殚_展開放合作的能力。在中國(guó)中國(guó)香港地區(qū),粵語(yǔ)是構(gòu)建當(dāng)?shù)鼐用裎幕匦缘闹匾糠?。為此,?dāng)?shù)貓F(tuán)隊(duì)必須研發(fā)正確的人工智能語(yǔ)言模型。

三星電子中國(guó)中國(guó)香港地區(qū)負(fù)責(zé)人Henry Wat表示:“在任何地方、任何行業(yè)中,語(yǔ)言以及溝通交流都非常重要。無(wú)論是來(lái)自哪里的語(yǔ)言,任何能幫助人們溝通交流的工具都是非??少F的,我堅(jiān)信我們的工作很有意義。”

圖片7.jpg

在下一期《學(xué)習(xí)曲線》中,我們將前往巴西,了解一個(gè)團(tuán)隊(duì)如何跨越文化和國(guó)界,讓更多人體驗(yàn)到Galaxy AI。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )