實現(xiàn)效果:
該AI智能小程序目前集成了百度AI開放平臺數(shù)十個AI服務(wù)產(chǎn)品功能,包括人臉識別、文字識別、表格識別、紅酒識別、貨幣識別、地標(biāo)識別、手勢識別、商標(biāo)識別、果蔬識別、菜品識別等圖片識別功能,以及黑白圖像上色、圖片風(fēng)格變換等圖像處理的功能。
1 系統(tǒng)框架
小程序?qū)⒊S霉δ馨碅i技術(shù)分為五大類:文字識別、語音技術(shù)、圖像技術(shù)、視頻技術(shù)和自然語言處理(NLP),然后根據(jù)具體功能再進(jìn)行細(xì)分。本文主要介紹百度AI開放平臺計算機(jī)視覺方面服務(wù)產(chǎn)品的測試過程及效果。通過微信小程序?qū)崿F(xiàn)API調(diào)用。小程序?qū)⒂脩羯蟼鞯膱D片提交給百度AI服務(wù),返回識別結(jié)果。全部功能都在小程序客戶端完成,不需要服務(wù)器,適合個人開發(fā)者學(xué)習(xí)調(diào)試使用,同時也為商業(yè)應(yīng)用提供相應(yīng)解決方案。
開發(fā)平臺:微信開發(fā)者工具 V1.02
開發(fā)語言:java script
測試環(huán)境:Andriod 9.0
2 微信小程序開發(fā)過程
2.1注冊微信小程序
注冊地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CN
注冊成功后在開發(fā)->開發(fā)者ID里找到AppID,這是開發(fā)微信小程序所需要的身份標(biāo)識。然后填寫服務(wù)器域名,需要用到的均要填上,如下圖。
2.2 小程序的配置已基本完成,下一步需要下載開發(fā)工具了,微信自己開發(fā)的IDE,下載地址是:
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html
2.3小程序開發(fā)文檔:https://developers.weixin.qq.com/miniprogram/dev/framework/
2.4小程序開發(fā)界面
如下圖,標(biāo)紅處需要填入注冊時獲得的APPID。
2.5程序總體結(jié)構(gòu)
Pages下的每個文件夾對應(yīng)實現(xiàn)一種AI功能。添加新的AI功能,比如添加駕駛證識別功能,在根目錄的全局配置文件app.json中增加:"pages/ driving_license/ driving_license",會自動創(chuàng)建相關(guān)頁面文件夾,其內(nèi)部結(jié)構(gòu)如下:
driving_license.js:功能邏輯模塊
driving_license.wxss:頁面樣式文件
driving_license.wxml:頁面布局文件
driving_license.json:頁面配置文件
3 程序功能實現(xiàn)說明
想了解微信小程序中百度API接口的調(diào)用過程,請參看我之前的帖子:
當(dāng)然,還有更多百度AI服務(wù)功能可以陸續(xù)添加,按照以上文章鏈接所提供的方法稍作修改即可。有興趣的同學(xué)可以試試。
4 測試效果
以下選取了部分圖片識別的測試效果:
4.1菜品識別
4.2 車型識別
4.3地標(biāo)識別
4.4動物識別
4.5紅酒識別
4.6 貨幣識別
4.7 植物識別
4.8 黑白圖像上色
4.9 清點人數(shù)
4.10 通用物體與場景識別
5 測試結(jié)論
5.1識別能力
根據(jù)拍攝照片,識別圖片內(nèi)容,廣泛應(yīng)用于娛樂類APP,自助結(jié)算等業(yè)務(wù)場景中。目前圖像識別具備的識別能力如下:
品牌logo識別:識別4萬種商品logo,支持定制logo圖庫
植物識別:識別2萬多種通用植物和近8千種花卉
動物識別:識別近8千種動物
菜品識別:識別超過近九千種菜品,支持定制菜品圖庫
地標(biāo)識別:識別5萬中外著名地標(biāo)、景點
果蔬識別:識別近千種水果和蔬菜
紅酒識別:識別數(shù)十萬中外紅酒名稱及詳細(xì)介紹
貨幣識別:識別國內(nèi)外常見貨幣,支持正反面、紀(jì)念鈔
車型識別:識別3千款常見車型,可返回車型百科信息
營業(yè)執(zhí)照識別:識別各版式營業(yè)執(zhí)照所有關(guān)鍵字段
增值稅發(fā)票識別:識別增值稅普票或?qū)F彼?0個字段
駕駛證識別:識別機(jī)動車駕駛證正本所有9個字段
車牌識別:識別藍(lán)牌、綠牌、單/雙行黃牌等類型車牌
手寫文字識別:識別圖片中的手寫數(shù)字、手寫中文
表格文字識別:識別表頭、表尾及每個單元格的文字內(nèi)容
人臉檢測:返回人臉框與關(guān)鍵點,識別多種人臉屬性
手勢識別:識別24種常見手勢,支持自拍、他人拍攝
5.2 特色優(yōu)勢
1)圖像識別功能豐富
支持多種垂類業(yè)務(wù)場景的細(xì)粒度圖像識別,精準(zhǔn)識別超過十萬種物體和場景,基于百度海量數(shù)據(jù),持續(xù)豐富接口返回內(nèi)容信息。
2)識別準(zhǔn)確性高
基于百度豐富的海量數(shù)據(jù),利用深度學(xué)習(xí)技術(shù)及精準(zhǔn)的算法迭代模型,不斷提高準(zhǔn)確性。
3)工作穩(wěn)定性好
提供24小時云端高穩(wěn)定服務(wù),宕機(jī)率低,故障恢復(fù)快,單圖毫秒級響應(yīng),服務(wù)可用性高達(dá)99.95%。
4)支持定制化識圖
支持根據(jù)不同的業(yè)務(wù)場景定制客戶專屬的AI識圖能力,滿足非通用場景下的業(yè)務(wù)需求。例如品牌logo,菜品識別均可自定義庫。
5)支持獲取百科信息
支持識別結(jié)果中返回百度百科的內(nèi)容,讓客戶業(yè)務(wù)功能更完善、內(nèi)容更豐富。
作者:wangwei8638
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。