智能小視頻解決方案上線,端到端全鏈路需求一站式解決!

原標(biāo)題:智能小視頻解決方案上線,端到端全鏈路需求一站式解決!

8月29日的“ABC SUMMIT 2019”百度云智峰會(huì)在京舉行。百度智能云帶著20大新產(chǎn)品,與近萬名的客戶、合作伙伴及開發(fā)者們共同見證了這場席卷而來的“人工智能工業(yè)化”時(shí)代浪潮。

而在智能視頻展臺(tái)及智能視頻分論壇,備受關(guān)注的百度智能云小視頻解決方案以智能、創(chuàng)新、開放、便捷的姿態(tài)重磅亮相。

據(jù)第三方數(shù)據(jù)顯示,2018年小視頻行業(yè)月獨(dú)立設(shè)備數(shù)已近7億臺(tái),2019年更是持續(xù)增長。隨著大視頻時(shí)代的到來,小視頻已應(yīng)用到各類場景中,不論是以短/小視頻內(nèi)容運(yùn)營為主營業(yè)務(wù)的APP,還是美食、母嬰、電商、生活等垂直APP,紛紛以小視頻UGC/PGC的方式,爭奪用戶時(shí)長。其中小視頻內(nèi)容的差異性、創(chuàng)新性、豐富性成為各大APP的核心抓手。

小視頻+AR

激發(fā)內(nèi)容創(chuàng)作新玩法

百度智能云移動(dòng)端小視頻創(chuàng)作SDK結(jié)合了DuMix AR 5.0人臉肢體手勢環(huán)境一體化交互技術(shù),讓視頻拍攝更美、更具趣味性。

人臉特效能力能精準(zhǔn)定位150個(gè)2D關(guān)鍵點(diǎn),涵蓋78個(gè)骨骼關(guān)鍵點(diǎn),能輸出3D人臉姿態(tài)。對于嘴部和眼球這兩個(gè)最“出戲”的部位,我們提供了更加精準(zhǔn)的解析,以保障應(yīng)用層可實(shí)現(xiàn)更多更優(yōu)的玩法。此外,我們還對人臉平面進(jìn)行了三角剖分,分成264個(gè)三角形,并進(jìn)行了5210個(gè)三角形人臉立體剖分,基于這個(gè)面部網(wǎng)格可以制作各種2D/3D貼紙、臉部變形等其他拓展。

同時(shí),我們預(yù)設(shè)了32個(gè)人臉表情基和15個(gè)表情語義,包含如微笑、大笑、睜眼、閉眼等一些常見的表情。通過內(nèi)置的19套塑形參數(shù)、5種基礎(chǔ)美妝、3D立體妝容等更加高階的能力,可以滿足開發(fā)者對于人臉特效玩法的各種需求,如美妝美體、微整形、多人實(shí)時(shí)換臉和個(gè)性化美顏需求等。并且在應(yīng)對光照劇烈變化、大角度追蹤、抖動(dòng)遮擋這些復(fù)雜情境都能表現(xiàn)出很強(qiáng)的穩(wěn)定性和魯棒性。

手勢特效預(yù)設(shè)了8種手勢語義,包含21個(gè)關(guān)鍵點(diǎn),能夠復(fù)原出3D的手掌姿態(tài);肢體特效提供59個(gè)輪廓點(diǎn)、18個(gè)關(guān)節(jié)點(diǎn)兩種輸出方式,其中18個(gè)關(guān)節(jié)點(diǎn)的識(shí)別速度,全機(jī)型測試最多不超過6.7毫秒;人像分割更是達(dá)到IOU 93.76%的高指標(biāo)。

從人體跟蹤到物理世界大場景跟蹤,依靠低成本的地圖采集和在線融合跟蹤方案,百度AR推出了VPAS視覺定位與增強(qiáng)服務(wù),用戶在打開時(shí)省去了掃描平面這一步驟,體驗(yàn)路徑更加順暢。開發(fā)者可以在真實(shí)世界中構(gòu)建更加宏大的虛擬場景,我們提供的實(shí)時(shí)渲染能力對于26萬面大場景在普通手機(jī)上的渲染幀率也達(dá)到了30fps。

開放架構(gòu)+創(chuàng)意工具+生態(tài)閉環(huán)

自主可控,靈活擴(kuò)展

大多數(shù)廠商的小視頻AR特效SDK是以一個(gè)黑盒的方式提供給開發(fā)者,開發(fā)者無法融入自己更多的算法和能力,無法靈活擴(kuò)展迭代自己的需求,只能強(qiáng)依賴于供應(yīng)商的迭代速度和基礎(chǔ)能力。因此,為了降低使用門檻,讓開發(fā)者們自主可控,百度DuMix AR平臺(tái)對架構(gòu)進(jìn)行了整合和改造,確保開發(fā)者可以自主高效地進(jìn)行能力和玩法擴(kuò)展。

如下圖所示,在算法層,開發(fā)者可以靈活加入自研或外采的其他算法和能力;在架構(gòu)層,提供了標(biāo)準(zhǔn)的管線搭建API、算法調(diào)度API、場景操作API以及易擴(kuò)展、可編程的渲染管線;在應(yīng)用層,針對不同需求的互動(dòng)特效貼紙的制作者,百度DuMix AR特效開放平臺(tái)也提供了兩套不同的工具:具備創(chuàng)意技術(shù)能力的PGC企業(yè)組織可以應(yīng)用Maya插件工具進(jìn)行內(nèi)容制作,也可以通過生態(tài)合作伙伴進(jìn)行定制化生產(chǎn);而廣泛的個(gè)人開發(fā)者則可以使用PC端的編輯器DuMix AR Studio和移動(dòng)端預(yù)覽工具DuMix AR Cam進(jìn)行開發(fā)和實(shí)時(shí)調(diào)試。

AI賦能

讓視頻編輯更高效更便捷

除了AR特效外,百度智能云小視頻創(chuàng)作SDK工具還提供了強(qiáng)大專業(yè)的后編輯能力:

  • Vlog剪輯:支持多段視頻剪輯、拼接、添加、刪除,以及視頻/圖片混編,可靈活調(diào)整片段的順序,可進(jìn)行畫面旋轉(zhuǎn),可添加轉(zhuǎn)場特效,縮略圖時(shí)碼線可實(shí)時(shí)預(yù)覽視頻內(nèi)容等。
  • 雙語字幕:通過語音識(shí)別能力一鍵將語音轉(zhuǎn)化成文本疊加字幕,并通過智能翻譯自動(dòng)實(shí)現(xiàn)雙語字幕。此外還提供了多種字幕包裝樣式,支持編輯字幕顏色、字體等,支持設(shè)置字幕背景、逐字運(yùn)動(dòng)等效果。
  • 編輯特效:除了拍攝特效外,在視頻編輯階段,也提供了豐富的特效能力,包括:畫面特效-黑白、放大、靈魂出竅、抖動(dòng)等;分屏特效-三屏、六屏、九屏特效等;時(shí)間特效-反復(fù)、變速、倒放等等;轉(zhuǎn)場特效-淡入、漸變等基礎(chǔ)特效和多種絢麗高級轉(zhuǎn)場。
  • 時(shí)光相冊:利用AI圖像理解技術(shù),根據(jù)人臉/地點(diǎn)等實(shí)現(xiàn)照片智能聚合,并根據(jù)風(fēng)格內(nèi)容理解,自動(dòng)匹配最優(yōu)的主題模版、標(biāo)題字幕和背景音樂。
  • 音頻編輯:我們聯(lián)合太和音樂提供了60w+的音樂版權(quán)庫,支持資源靈活對接和配置等。同時(shí),我們提供音軌分離,多段音頻的剪輯,音頻的轉(zhuǎn)場特效等編輯能力。

一站式智能小視頻解決方案

助您一天搭建小視頻業(yè)務(wù)

除了小視頻SDK外,百度智能云構(gòu)建了智能小視頻端到端全鏈路解決方案,提供了采、編、播、管、存、發(fā)等小視頻一站式服務(wù),開發(fā)者僅需簡單幾步即可拉起一個(gè)小視頻APP。在小視頻競爭白熱化的階段,讓您能更快更高效的上線小視頻業(yè)務(wù),專注業(yè)務(wù)運(yùn)營,贏在起點(diǎn)。

智能小視頻解決方案涵蓋了移動(dòng)端和服務(wù)端,移動(dòng)端包含了小視頻創(chuàng)作SDK、播放器SDK、FEED流、完整APP模版,服務(wù)端包含了小視頻的管理、存儲(chǔ)、轉(zhuǎn)碼、抽幀、審核、去重、標(biāo)簽化、分發(fā)、個(gè)性化推薦等。其中,小視頻創(chuàng)作SDK提供了全面智能的AR特效和視頻編輯能力,激發(fā)用戶創(chuàng)新玩法,打造內(nèi)容差異化。而MCT智感超清轉(zhuǎn)碼在保證同等畫質(zhì)的情況下,大大降低了視頻碼率,大幅度降低了帶寬存儲(chǔ)成本。自動(dòng)審核/智能去重/智能標(biāo)簽更是提高了內(nèi)容管理運(yùn)營的效率和小視頻分發(fā)推薦的質(zhì)量。

智能小視頻整體優(yōu)勢如下:

  • 全面賦能:全面的能力矩陣,端到端全流程解決方案,AI加持,全面賦能創(chuàng)業(yè)團(tuán)隊(duì);
  • 簡單快捷:標(biāo)準(zhǔn)易用的配置操作引導(dǎo),小視頻業(yè)務(wù)上線,快人一步;
  • 創(chuàng)新引領(lǐng):最智能的AR特效拍攝工具,最I(lǐng)N的視頻生產(chǎn)玩法,引領(lǐng)業(yè)界風(fēng)向標(biāo);
  • 開放源碼:APP模版和對應(yīng)server服務(wù)開放源碼,方便個(gè)性化定制開發(fā);

基于百度智能云在ABC領(lǐng)域的技術(shù)實(shí)力,智能小視頻解決方案充分展現(xiàn)了AR、AI、渲染能力上的優(yōu)勢,為視頻企業(yè)帶來了最I(lǐng)N、最全、最智能的解決方案,助力企業(yè)及廣大開發(fā)者快速、高效、低價(jià)上線短視頻業(yè)務(wù)。未來,百度智能云將繼續(xù)賦能行業(yè),全面引領(lǐng)短視頻行業(yè)新風(fēng)向。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-09-06
智能小視頻解決方案上線,端到端全鏈路需求一站式解決!
如下圖所示,在算法層,開發(fā)者可以靈活加入自研或外采的其他算法和能力;在架構(gòu)層,提供了標(biāo)準(zhǔn)的管線搭建API、算法調(diào)度API、場景操作API以及易擴(kuò)展、可編程的渲染管線;在應(yīng)用層,針對不同需求的互動(dòng)特效貼

長按掃碼 閱讀全文