海量數(shù)據(jù)下,八戒知識(shí)產(chǎn)權(quán)是如何解決“以圖搜圖”難題的?

移動(dòng)互聯(lián)網(wǎng)世界,我們的信息獲取方式很大程度上依賴于搜索。

然而,即使是技術(shù)最為完善的文字搜索,往往也有其乏力的地方。比如,對(duì)于商標(biāo)圖片,如果你不知道編碼,蒼白的文字描述是很難幫你正確檢索到你需要知道的商標(biāo)圖形的。而此時(shí),你就需要“以圖搜圖”的功能來(lái)實(shí)現(xiàn)。

正是發(fā)現(xiàn)這一市場(chǎng)痛點(diǎn),八戒知識(shí)產(chǎn)權(quán)在2016年開始了商標(biāo)圖形檢索系統(tǒng)的研發(fā),并于2017年1月成功上線。

海量數(shù)據(jù)下,八戒知識(shí)產(chǎn)權(quán)是如何解決“以圖搜圖”難題的?

  商標(biāo)檢索結(jié)果頁(yè)面

告別繁復(fù)的檢索

近年來(lái),隨著雙創(chuàng)浪潮的推動(dòng),以及品牌意識(shí)的逐步增強(qiáng),企業(yè)對(duì)商標(biāo)的重視程度可謂逐年提高。有數(shù)據(jù)顯示,2016年國(guó)內(nèi)商標(biāo)申請(qǐng)注冊(cè)量為350萬(wàn)件,年增速超過20%。隨著創(chuàng)業(yè)公司激增和品牌意識(shí)增強(qiáng),商標(biāo)申請(qǐng)量將繼續(xù)攀升,僅2018年全國(guó)商標(biāo)注冊(cè)申請(qǐng)量就超過700萬(wàn)件。

由于商標(biāo)在注冊(cè)過程中需要進(jìn)行唯一性審查,所以檢索重復(fù)商標(biāo)就成了商標(biāo)注冊(cè)代理機(jī)構(gòu)的首要工作。就商業(yè)領(lǐng)域而言,商標(biāo)包括文字、圖形、字母、數(shù)字、三維標(biāo)志和顏色組合。以往,大部分代理都采用白兔系統(tǒng)。但該系統(tǒng)僅能檢索文字商標(biāo),對(duì)于復(fù)雜的圖形商標(biāo),工作人員只能通過人工審查的方式進(jìn)行,而用圖形內(nèi)容檢索的方式則無(wú)疑更加高效。

盡管包括Google、百度等搜索引擎均提供以圖搜圖功能,但因圖像相似度判別復(fù)雜度的影響,圖像檢索需要區(qū)分場(chǎng)景才能獲得最佳效果。由于商標(biāo)圖形數(shù)據(jù)非常獨(dú)特,所以直接利用搜索引擎已有的圖形檢索,其結(jié)果往往無(wú)法滿足使用者需求。

八戒知識(shí)產(chǎn)權(quán)商標(biāo)圖形檢索系統(tǒng)負(fù)責(zé)人王豪杰介紹,圖形商標(biāo)搜索包含三步:識(shí)別、理解和檢索。在提取特征點(diǎn)進(jìn)行基礎(chǔ)識(shí)別之后,搜索系統(tǒng)需要通過深度學(xué)習(xí)算法對(duì)圖片進(jìn)行理解,找到相對(duì)精確的備選圖形,隨后通過檢索按照相似度排序?yàn)橛脩籼峁┳罘蠗l件的圖形商標(biāo)。

“一般而言,圖片搜索的運(yùn)算量至少是文字搜索運(yùn)算量的千倍以上,加上圖形搜索比較重視搜索場(chǎng)景,因此對(duì)硬件系統(tǒng)和軟件系統(tǒng)要求很高。而圖形商標(biāo)由于抽象化、非標(biāo)準(zhǔn)化等特性,也使得這項(xiàng)技術(shù)比人臉?biāo)阉鞯葓D形搜索難度要更大,研發(fā)周期也更長(zhǎng)。”王豪杰說(shuō)。

但這不符合創(chuàng)業(yè)者分秒必爭(zhēng)態(tài)度,所以,八戒知識(shí)產(chǎn)權(quán)希望利用圖像比較技術(shù)和搜索引擎技術(shù),研發(fā)出了一套符合商標(biāo)審查、準(zhǔn)確、高效的商標(biāo)圖形檢索系統(tǒng)。

海量數(shù)據(jù)下,八戒知識(shí)產(chǎn)權(quán)是如何解決“以圖搜圖”難題的?

  商標(biāo)圖形檢索系統(tǒng)界面

跨入只需3秒的以圖搜圖時(shí)代

傳統(tǒng)商標(biāo)審查需人工判別:630多萬(wàn)個(gè)圖形商標(biāo)按照1806種圖形要素分類,將每個(gè)要素下的商標(biāo)與需判別的商標(biāo)進(jìn)行比對(duì),以此判斷商標(biāo)申請(qǐng)是否通過。

由于商標(biāo)局審查員對(duì)于近似商標(biāo)的判定具有較大的自由裁量權(quán),八戒知識(shí)產(chǎn)權(quán)在深入了解審查原則和審查員習(xí)慣的基礎(chǔ)上,利用專業(yè)的圖像比較技術(shù)和搜索引擎技術(shù),對(duì)商標(biāo)圖像進(jìn)行了視覺分析及特征提取,并對(duì)數(shù)據(jù)庫(kù)的數(shù)百萬(wàn)張圖像特征創(chuàng)建了數(shù)據(jù)索引。在查詢時(shí),自動(dòng)對(duì)檢索結(jié)果進(jìn)行優(yōu)化排序,并在輸出結(jié)果后提供了多種可自定義的篩選與條件過濾等功能。

經(jīng)過一年的時(shí)間,團(tuán)隊(duì)五個(gè)技術(shù)成員,迭代了十幾版,目前八戒知識(shí)產(chǎn)權(quán)已將搜索系統(tǒng)運(yùn)算速度從3分鐘壓縮到3秒以內(nèi),系統(tǒng)也由原來(lái)按照?qǐng)D形商標(biāo)1806種要素搜索改變?yōu)槿珟?kù)搜索,搜索結(jié)果的錯(cuò)誤率在5%以內(nèi)。

同時(shí),通過優(yōu)化核心算法,使硬件成本降低了30%,現(xiàn)在用7臺(tái)服務(wù)器可以實(shí)現(xiàn)原來(lái)運(yùn)行十臺(tái)服務(wù)器的效果,降低了項(xiàng)目的運(yùn)維成本。

如今,八戒知識(shí)產(chǎn)權(quán)的商標(biāo)圖形檢索系統(tǒng),有著領(lǐng)先的圖片檢索技術(shù),以圖搜圖只需要將目標(biāo)圖片上傳,一鍵檢索即可找到相似商標(biāo)圖形詳細(xì)信息,還可以對(duì)結(jié)果進(jìn)行篩選,使得你找到更加精確的結(jié)果,不但節(jié)約的商標(biāo)檢索的時(shí)間也大大提高了商標(biāo)申請(qǐng)的通過率。

現(xiàn)在圖形商標(biāo)搜索市場(chǎng)各路玩家陸續(xù)加入,從傳統(tǒng)的機(jī)構(gòu)如國(guó)方、集佳、社文到新興的互聯(lián)網(wǎng)機(jī)構(gòu),比如智慧芽,還有產(chǎn)業(yè)投資密集并購(gòu)。大家齊頭并進(jìn),暫未出現(xiàn)一家獨(dú)大的局面。

對(duì)于來(lái)自領(lǐng)域內(nèi)蜂擁而至的競(jìng)爭(zhēng),王豪杰認(rèn)為這并非壞事。“任何市場(chǎng)都有競(jìng)爭(zhēng),競(jìng)爭(zhēng)一方面可以壓迫自身的不斷發(fā)展,另一方面也可以促進(jìn)市場(chǎng)的繁榮。而最重要的,其實(shí)不是市場(chǎng)有多大,而是自己能吃下的蛋糕有多大。”

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-03-15
海量數(shù)據(jù)下,八戒知識(shí)產(chǎn)權(quán)是如何解決“以圖搜圖”難題的?
移動(dòng)互聯(lián)網(wǎng)世界,我們的信息獲取方式很大程度上依賴于搜索。然而,即使是技術(shù)最為完善的文字搜索,往往也有其乏力的地方。

長(zhǎng)按掃碼 閱讀全文