原標題:5月百度智能云AI能力又雙叒叕更新了,這次又解鎖了哪些新能力?
人工智能作為如今最前沿的技術(shù)之一,每天都處于快速的更新迭代中。為了給客戶提供最優(yōu)質(zhì)的服務(wù),百度智能云也在不斷升級自己的AI能力,推出更多產(chǎn)品和解決方案,助力企業(yè)的智能化轉(zhuǎn)型。
接下來,我們將為您盤點一下百度智能云5月份AI技術(shù)的更新情況,希望對您的業(yè)務(wù)有所幫助。
更多AI技術(shù)能力上新
AI技術(shù)能力方面,5月,百度智能云在語音合成、文字識別、人體分析、圖像識別四個技術(shù)方向上均有新能力提供,也催生了更多業(yè)務(wù)場景。
1、語音合成:全新推出精品音庫
這次的語音合成產(chǎn)品新增了5個精品音庫,包括童聲音庫度米朵、度小童、情感男聲度博文、情感女聲度小嬌、度小雯,可以滿足更豐富的場景需求。
2、文字識別OCR
? 手寫文字識別模型升級
支持對圖片中的手寫中文、手寫數(shù)字進行檢測和識別,針對不規(guī)則的手寫字體進行專項優(yōu)化,中文識別準確率提升38%以上,識別準確率可達90%以上;而且現(xiàn)在注冊還可以享受 50次/天的免費調(diào)用額度,先試后買,讓您用著更放心。開通付費后即可無限調(diào)用,價格低至4.5元/千次起。
? 數(shù)字識別模型升級
支持對圖片中的數(shù)字進行提取和識別,自動過濾非數(shù)字內(nèi)容,返回結(jié)果包含數(shù)字內(nèi)容及其位置信息,識別準確率超過99%;同樣,現(xiàn)注冊就可以領(lǐng)取 200次/天的免費調(diào)用額度,開通付費后,并發(fā)量即可提升至10次/秒,超出免費額度將按次進行階梯計費;價格低至2元/千次起。
? 身份證識別模型升級
1)正面:即人像面——住址字段識別準確率提升至95%+。
2)反面:即國徽面——簽發(fā)機關(guān)字段識別準確率提升至98%+。
? 銀行卡識別模型升級
支持對銀行卡的卡號、有效期、發(fā)卡行、卡片類型4個關(guān)鍵字段進行結(jié)構(gòu)化識別,識別準確率超過99%。模型升級支持識別更多地方銀行的銀行卡及非常規(guī)卡片(如卡號在背面)。
? 出租車票識別模型升級
支持城市由北、上、深擴增至全國30余個主要城市和地區(qū),精準識別出租車票的6個關(guān)鍵字段,包括發(fā)票號碼、代碼、車號、日期、時間、金額。
? 網(wǎng)絡(luò)圖片文字識別模型升級
模型升級,整體識別準確率提升11.8%,能夠快速準確識別各種網(wǎng)絡(luò)圖片中的文字,在復(fù)雜字體和復(fù)雜背景的情況下仍能保持非常高的識別準確率。
3、人體分析:人體檢測與屬性識別模型升級
百度智能云在5月對人體分析模型進一步升級,21類屬性的平均準確率從84.4%提升至88.1%。
4、圖像識別
? 紅酒識別技術(shù)正式開放
識別圖像中的紅酒標簽,返回紅酒名稱、國家、產(chǎn)區(qū)、酒莊、類型、糖分、葡萄品種、酒品描述等信息,可識別數(shù)十萬中外紅酒。
? 貨幣識別技術(shù)正式開放
識別圖像中的貨幣類型,返回貨幣名稱、代碼、面值、年份信息,可識別百余種國內(nèi)外常見貨幣。
? 通用物體與場景識別模型升級
模型升級,Top1準確率絕對值提升7%。支持超過10萬類物體和場景識別,接口返回單張圖片內(nèi)的1個或多個物體的名稱,并關(guān)聯(lián)百科詞條信息,廣泛應(yīng)用于廣告及內(nèi)容推薦等業(yè)務(wù)場景中。
? 植物識別模型升級
模型升級,Top1準確率絕對值提升11.76%。支持識別2萬多種植物和近8000種花卉,接口返回植物的名稱及百科信息,適用于拍照識圖類APP中。
更豐富的AI開發(fā)平臺
5月,百度智能云新開放了2個AI開發(fā)平臺,包括:EasyDL定制視頻分類和iOCR財會版。除此之外,智能對話訓(xùn)練和服務(wù)平臺UNIT全面升級至3.0,有哪些新功能,一起來看看吧!
1、EasyDL定制視頻分類
面向視頻分析場景,通過標注每類50個、10s以內(nèi)的視頻片段進行訓(xùn)練,從而實現(xiàn) “需要連續(xù)圖片幀組合判斷”的視頻內(nèi)容分析,可用于定制工人操作行為規(guī)范識別AI模型、定制物體移動方向判斷的AI模型等業(yè)務(wù)場景中。
2、iOCR財會票據(jù)識別
新開放的iOCR財會版為財務(wù)工作者帶來了福音,許多繁瑣的工作以后都有AI平臺代勞啦。目前已經(jīng)開放的功能包括:
1)新增票據(jù)檢測分類功能,可直接識別發(fā)票粘貼單上的多張不同類型發(fā)票。
2)系統(tǒng)預(yù)置7種報銷常用票據(jù)模板、4大行及招商銀行的銀行對賬單模板,可滿足80%以上財會場景需求。
3)對于特殊票據(jù),支持快速自定義模板及分類器。
4)底層模型針對財會場景進行專項優(yōu)化:支持自動去紅章;支持套打偏移識別;金額數(shù)字識別精度更高。
3、理解與交互技術(shù)UNIT 3.0
? 重磅發(fā)布「我的知識」,一站式實現(xiàn)知識挖掘與語義理解
「我的知識」模塊在UNIT中引入了百度知識圖譜通用算法集合,幫助開發(fā)者使用自有數(shù)據(jù)構(gòu)建企業(yè)圖譜知識庫與問答知識庫,挖掘的知識可用于優(yōu)化技能模型的理解效果、完善對話流程的控制與答復(fù)。
? 全新推出「對話式文檔問答」,導(dǎo)入業(yè)務(wù)文檔自動構(gòu)建對話模型
基于「對話式文檔問答」技術(shù),開發(fā)者只需導(dǎo)入業(yè)務(wù)文檔,即可自動構(gòu)建出基于文檔理解的對話技能,允許開發(fā)者對對話效果進行調(diào)優(yōu),具備持續(xù)學(xué)習(xí)能力,大幅降低了產(chǎn)品介紹、說明等場景下的智能業(yè)務(wù)問答開發(fā)成本。
? 全新發(fā)布對話日志挖掘工具「Data Kit」,大幅提升模型調(diào)優(yōu)效率
離線對話日志挖掘工具Data Kit,支持從對話日志中挖掘出對話訓(xùn)練樣本,來訓(xùn)練、優(yōu)化對話模型的理解效果,幫助開發(fā)者以低成本不斷提升模型理解效果,樣本生產(chǎn)和標注效率平均提升8倍。
? 開放支持自定義調(diào)優(yōu)的離線SDK,確保斷網(wǎng)環(huán)境下的語義解析能力
具有端計算能力的離線SDK,可提供智能車載、智能家居等多個場景下的離線場景文件,并支持自定義調(diào)優(yōu),實現(xiàn)設(shè)備在斷網(wǎng)環(huán)境下也可以提供語義解析服務(wù)。
? 預(yù)置技能增至58個,滿足更多場景需求
新上線可定制預(yù)置技能3個,包括會議室預(yù)定、電臺控制、購買藥品,開發(fā)者可以根據(jù)業(yè)務(wù)需求調(diào)整這些技能的詞典,讓預(yù)置技能效果更貼合業(yè)務(wù);同時還上線了含資源預(yù)置技能:成語問答、計算器、進制轉(zhuǎn)換、單位換算,可直接解析出問題的答案。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。