程序員們,快把這款AI“魔法”做到手機相機里,求求了

這位胖友,你聽說過“鏡頭恐懼”嗎?

包括但不限于,總是盡力躲避鏡頭,即使拍照也往往表情尷尬,笑不出來。

1.png

那感覺,就是人家拍照是回眸一笑百媚生:

2.png

(圖片來自:山東畫報《老照片》第94輯)

我一上相就是“我是誰”、“我在哪”、“我在干什么”靈魂三連。

現(xiàn)在各種算法技術(shù)這么發(fā)達,就不能我往鏡頭前一站,相機自動幫我微笑到位嗎???

真別說,本老鏡頭恐懼癥患者仔細查了查,發(fā)現(xiàn)這事兒還挺靠譜。

比如前面這張阮玲玉露齒而笑的照片,原片其實長這樣:

3.png

嘴角這么一揚,老照片里的清冷美女,是不是就多了一些鮮活的嫵媚溫柔?

再看林徽因和她的表姐妹們,微笑加持,少女的天真本性就仿佛透過照片穿越了時代。

4.png

(左圖來自:山東畫報《老照片》第8輯)

關(guān)鍵是,AI這一手微笑P圖,著實是P得行云流水不著痕跡。

不僅嘴角上揚,連帶蘋果肌的變化也刻畫到位,細節(jié)拉滿。

5.png

(左圖來自:山東畫報《亞細亞大觀》)

此刻的我只想說:

6.png

媽媽再也不用擔心我拍照不會笑

不過說實話,從技術(shù)的角度來看,雖然現(xiàn)在的各種AI“P圖”大法百花齊放,真要自己手動實現(xiàn)一個,麻煩事兒屬實不少。

以這個“一鍵微笑”為例,別看只是一個微笑的動作,背后涉及的算法環(huán)節(jié)就包括:

1.人臉檢測

2.面部關(guān)鍵點識別

3.面部屬性識別

4.目標表情驅(qū)動

……

而具體到細節(jié),關(guān)鍵的一步,就是要把人臉圖像分割成高度精細的語義塊,使得圖像與像素級語義分割相匹配。

7.png

只有經(jīng)過類似這樣的操作,才能讓表情編輯與人臉本身的狀態(tài)相貼合,達到真實自然的效果。

還有一重難點在于數(shù)據(jù)集。

一鍵微笑背后的算法模型最終效果好不好,很大程度上依賴于人臉數(shù)據(jù)集的構(gòu)建。

數(shù)據(jù)集中包含的人臉越多越豐富,AI算法就能學到越多的人臉特征,提高輸出結(jié)果的精準度。但人臉數(shù)據(jù)集的獲取又往往涉及到用戶隱私等多種問題,較難采集。

8.jpeg

但橋豆麻袋,我也不是在為難各位攻城獅,因為這事兒啊,也不是沒有現(xiàn)成的捷徑可以走。

開頭的這么一套AI“魔法”,其實就是我最近了解到的華為HMS Core提供的AI“一鍵微笑”功能。

所謂HMS Core,官方說法是華為終端云服務(wù)(HUAWEI Mobile Services)開放能力合集。

簡單翻譯一下,就是一個給移動端開發(fā)者們提供各種App基礎(chǔ)應用服務(wù),以及圖形、媒體、AI等一系列算法能力的平臺。

其中媒體領(lǐng)域的視頻編輯服務(wù)(Video Editor Kit)提供了專屬濾鏡、AI著色、人物追蹤等多種AI能力。而一鍵微笑能力正是來自于此Kit能力。

對于開發(fā)者們而言,這便意味著,不用費力調(diào)教模型,僅需幾行代碼,簡單接入華為HMS Core開放的SDK,就能低門檻地復制同款AI“微笑魔法”。

可以看到,基于面部識別算法以及數(shù)據(jù)集的優(yōu)化,與FaceApp等相比,Video Editor Kit的微笑處理偏合理含蓄,微笑自然且不會改變原本人臉的合理結(jié)構(gòu)。

9.png

HMS Core研發(fā)團隊依托自研的人臉生成模型,結(jié)合算法利用部分真實人臉圖片,生成大量的虛擬人臉圖片來訓練微笑模型,比如可以基于數(shù)千張具有肖像權(quán)的人臉圖片,生成百萬張?zhí)摂M人臉數(shù)據(jù)集。然后再利用自研算法模型,從人臉數(shù)據(jù)集中生成了“開心數(shù)據(jù)對”,也就是一系列的笑臉。最終,從中選出更符合原圖人臉面部狀態(tài)、更自然合理的微笑。

Video Editor Kit的“一鍵微笑”功能近期會在華為開發(fā)者聯(lián)盟官網(wǎng)上線,有興趣的小伙伴可以嘗試下~

除了賦予照片中人自然微笑的能力,Video Editor Kit在處理老照片時,還展示了另一重AI能力:AI著色。

與此前火爆外網(wǎng)、成為老照片修復界標桿的MyHeritage相比,來自華為的AI著色風格強調(diào)的不是“復古感”,而是更貼近真實生活。

10.png

△左為華為Video Editor Kit,右為MyHeritage

據(jù)了解,Video Editor Kit的AI著色是通過設(shè)計輕量算法模型、構(gòu)建百萬數(shù)據(jù)集,和優(yōu)化調(diào)整訓練方式,來讓照片著色更自然。

另外,相對而言,Video Editor Kit的AI著色賦予老照片的色彩飽和度更低一些,更便于后期處理

復雜算法一個SDK就搞定,應用開發(fā)超簡單

這里咱們就以AI著色為例,看看在自己App中集成HMS Core的AI能力,需要經(jīng)過哪些步驟。

首先,你需要在華為開發(fā)者聯(lián)盟網(wǎng)站上完成實名注冊。

第二步就到了集成HMS Core視頻編輯服務(wù)(Video Editor Kit)的視頻編輯原子能力SDK。該SDK不僅提供導入、編輯、渲染、導出、媒體資源管理等一站式視頻編輯能力,還涵蓋了多個AI算法能力接口,可根據(jù)業(yè)務(wù)場景靈活選擇。

在快速集成SDK之后,只需要增加幾行代碼就可以調(diào)用AI著色能力,輕松實現(xiàn)圖片和視頻處理的AI智能化:

11.png

除了詳細的開發(fā)指南之外,HMS Core官網(wǎng)還提供了Codelabs、服務(wù)教程和開發(fā)實例,幫助開發(fā)者快速集成SDK,進一步降低了應用開發(fā)的門檻。

需要說明的是,視頻編輯服務(wù)(Video Editor Kit)的SDK不僅支持華為手機,也支持非華為設(shè)備,具體版本要求如下。

12.png

另外小小地提醒一下:人臉算法千萬條,安全守法第一條。大膽的想法,還是收一收吧~

降低開發(fā)門檻的“基座”

看到這里,你是否有些躍躍欲試了呢?

簡單接入SDK即可獲得復雜的AI算法能力,對于App的開發(fā)者們而言,技術(shù)層面的顧慮減少了,自然可以投入更多的精力和時間去豐富創(chuàng)意。

而對于咱們吃瓜群眾來說,這也就意味著,你能在HMS Core里找到的開放能力,都能在各種App里,以各種好玩的創(chuàng)意形式直接體驗到。

實際上,無論是安卓還是iOS,各自生態(tài)內(nèi)類似的“基座”,如今都已是大勢所趨。

谷歌的GMS Core也好,蘋果面向開發(fā)者的各種Kit也罷,都已證明其在各自生態(tài)內(nèi),推動中小應用開發(fā)者創(chuàng)意落地的價值所在。

而這種應用的繁榮,反過來也進一步為安卓、為iOS獲得了更多用戶的好評、吸引了更多優(yōu)秀的開發(fā)者。

13.jpeg

作為全球Top 3移動應用生態(tài)的HMS,同樣在這條“基建”之路上探索已久:

在去年HMS Core 6正式發(fā)布之時,華為官方的數(shù)據(jù)就顯示,其開放能力已覆蓋應用服務(wù)、圖形、媒體、智能終端、人工智能、安全、連接與通信在內(nèi)的7個領(lǐng)域,總共70個Kit能力。

截至2022年Q1,HMS生態(tài)中的開發(fā)者數(shù)量,已經(jīng)超過540萬。

可以說,華為搭起了臺子讓移動應用開發(fā)者來唱戲,相當于是在移動應用生態(tài)里構(gòu)建起了一套全新獨立的基礎(chǔ)設(shè)施。

并且不僅面向HarmonyOS,HMS Core也支持安卓和iOS的應用和服務(wù)開發(fā)。同時也在平板、智慧屏、智能手表及車機等更多智能終端上布局。

更重要的一點是,作為手機軟件能力之基,HMS被推至臺前,或許也可以看作是華為將多年積累的創(chuàng)新能力寶藏分享給了全球的應用開發(fā)者。

你覺得呢?

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )