創(chuàng)新引領(lǐng)發(fā)展,龍貓數(shù)據(jù)用新技術(shù)賦能AI贏取未來

互聯(lián)網(wǎng)之“冷”與人工智能之“熱”

創(chuàng)新引領(lǐng)發(fā)展,龍貓數(shù)據(jù)用新技術(shù)賦能AI贏取未來

10月中旬以來,多家互聯(lián)網(wǎng)知名公司被曝出大規(guī)模裁員消息,不管是以“業(yè)務(wù)調(diào)整”為借口,還是以“人員優(yōu)化”為理由,互聯(lián)網(wǎng)行業(yè)就業(yè)景氣程度大不如前是不爭的事實。根據(jù)《中國就業(yè)市場景氣報告》顯示,今年第三季度的招聘需求人數(shù)與去年同期相比下降了27%,出現(xiàn)了八年來的首次下降。

在互聯(lián)網(wǎng)就業(yè)市場一片陰冷之中,人工智能卻成為了最火的熱詞,從政府工作報告到行業(yè)峰會大會,再到技術(shù)應(yīng)用落地,我們見證了人工智能引領(lǐng)變革、帶來生機(jī)的一次次驚艷表現(xiàn)。人工智能專業(yè)應(yīng)屆生動輒50萬的年薪刺激著無數(shù)人的神經(jīng),而在人工智能光鮮一面的背后,作為算法優(yōu)化過程的重要一環(huán)——數(shù)據(jù)標(biāo)注,目前全職從業(yè)者已達(dá)到10萬,兼職人群的規(guī)模更是接近100萬。

截至2018年6月,全球人工智能企業(yè)已達(dá)5000余家,中國占據(jù)五分之一之多。AI企業(yè)的核心要素除了算法便是精準(zhǔn)標(biāo)注過的數(shù)據(jù),這也催生了中國大量標(biāo)注公司、標(biāo)注團(tuán)隊出現(xiàn)。據(jù)不完全統(tǒng)計,除去人工智能巨頭本身擁有的數(shù)據(jù)標(biāo)注團(tuán)隊,國內(nèi)專業(yè)的數(shù)據(jù)標(biāo)注公司超過50余家,大大小小的外包團(tuán)隊超過500家,AI的火熱可見一斑。

  精度、效率與門檻:圖像標(biāo)注業(yè)身上的“三座大山”

創(chuàng)新引領(lǐng)發(fā)展,龍貓數(shù)據(jù)用新技術(shù)賦能AI贏取未來

數(shù)據(jù)標(biāo)注的精準(zhǔn)性對算法優(yōu)化結(jié)果起到了決定性作用,這就要求數(shù)據(jù)標(biāo)注必須高質(zhì)量完成。而產(chǎn)品研發(fā)的緊迫性、行業(yè)競爭的白熱化決定了標(biāo)注數(shù)據(jù)的產(chǎn)出必須極其關(guān)注效率,可能一次數(shù)據(jù)標(biāo)注的拖延就將導(dǎo)致產(chǎn)品上市的滯后,造成競爭力下降,甚至直接危及初創(chuàng)企業(yè)的生死存亡。

在圖像標(biāo)注領(lǐng)域,擁有自主標(biāo)注平臺的數(shù)據(jù)服務(wù)公司本身就不多,而目前國內(nèi)圖像標(biāo)注平臺普遍采用的還是兩種標(biāo)注方式:打點連線和PS技術(shù)。打點連線就是沿著要標(biāo)注的物體邊沿打上足夠多的點,然后通過連成線標(biāo)注出對象輪廓。這一方式門檻低但極其繁瑣,只適用于交通線等直線標(biāo)注標(biāo)注效果也不夠理想。另一方式是通過PS等畫面處理技術(shù)標(biāo)注,準(zhǔn)入門檻較高,只有深度掌握PS等繪圖技術(shù)才能夠進(jìn)行,標(biāo)注時間和人力成本高,且導(dǎo)出格式單一,達(dá)不到客戶要求,成為制約圖像標(biāo)注時效和質(zhì)量的一大瓶頸,也成為普通數(shù)據(jù)標(biāo)注員的一大心病:明明有標(biāo)注任務(wù)和需求,卻因為難以掌握相關(guān)技能而失之交臂。

如何在降低標(biāo)注成本的前提下提升標(biāo)注精度和效率,不僅成為標(biāo)注行業(yè)本身的一塊心病,也成為整個AI產(chǎn)業(yè)發(fā)展的制約。可以說,誰能夠突破制約,找到解決之道,誰就能在激烈的標(biāo)注業(yè)競爭中站穩(wěn)腳跟,實現(xiàn)長足發(fā)展。

臨危受命:他們遇到標(biāo)注以來最大挑戰(zhàn)

創(chuàng)新引領(lǐng)發(fā)展,龍貓數(shù)據(jù)用新技術(shù)賦能AI贏取未來

  普通標(biāo)注:邊緣處理較困難,精度低

作為數(shù)據(jù)采集和標(biāo)注領(lǐng)域的領(lǐng)軍企業(yè),北京安捷智合科技有限公司(龍貓數(shù)據(jù))在AI發(fā)展中積累了大量經(jīng)驗,服務(wù)過超過100家的AI大型公司,累計提供行業(yè)解決方案超500個,并自主建立起國內(nèi)第一個數(shù)據(jù)+算力的AI綜合服務(wù)平臺,為AI發(fā)展做出了突出貢獻(xiàn)。

然而任何企業(yè)的發(fā)展都不可能一帆風(fēng)順,特別是正在快速成長期的公司。就在前不久,龍貓數(shù)據(jù)遇到了開展數(shù)據(jù)標(biāo)注業(yè)務(wù)以來最大的挑戰(zhàn)。某客戶為了產(chǎn)品能夠趕在競品之前上市,要求龍貓數(shù)據(jù)在一周內(nèi)為他們提供超過5萬張的精細(xì)標(biāo)注圖,內(nèi)容涵蓋汽車、道路、自然風(fēng)景、人臉等多個項目,且標(biāo)注精度要求極其高,標(biāo)注圖像的邊緣必須達(dá)到PS標(biāo)注級別。

如果只是小批量標(biāo)注,或許還可以找到足夠多懂得PS技術(shù)的人來完成任務(wù)。但面對如此大的需求量,面對如此緊迫的任務(wù)周期,就連龍貓經(jīng)驗豐富的項目經(jīng)理也感受到了巨大的壓力。“用PS肯定標(biāo)不完的,人不夠,時間也不夠”,這是出于經(jīng)驗的判斷。他們馬上找了一批打點標(biāo)注的人進(jìn)行精細(xì)標(biāo)注,想通過更多人參與解決問題。

標(biāo)注結(jié)果剛傳到客戶手里就馬上引來不滿,“這樣的標(biāo)注怎能達(dá)到我們的要求?你們還想不想繼續(xù)合作?”

化壓力為動力,從創(chuàng)新處找答案

創(chuàng)新引領(lǐng)發(fā)展,龍貓數(shù)據(jù)用新技術(shù)賦能AI贏取未來

  超像素分割標(biāo)注:精準(zhǔn),高效,簡單,

面對客戶的高標(biāo)準(zhǔn)嚴(yán)要求,有些人打起了退堂鼓。“要不這項目我們不做了?我們有那么多項目,這個不做我們也沒什么損失”。在產(chǎn)品、技術(shù)、運營的聯(lián)合會議上,負(fù)責(zé)人明確告訴大家:“這項目我們必須做,哪怕花再大代價,我們也要讓客戶滿意,這是龍貓一直堅持的信念!再說這個我們不做,國內(nèi)恐怕也沒有第二家能夠按要求做出來”。

負(fù)責(zé)人的態(tài)度感染了每一個人。大家都在努力想辦法,但按照目前的現(xiàn)實情況,想要實現(xiàn)承諾真是天方夜譚。產(chǎn)品團(tuán)隊在會后進(jìn)行頭腦風(fēng)暴,集思廣益尋找思路。但囿于國內(nèi)標(biāo)注現(xiàn)狀,大家想的還是傳統(tǒng)的解決方法,很難從根本上解決問題。

這時候,團(tuán)隊的一名“老隊員”——他在公司成立半年后就來這兒工作了,說道“要不我們考慮下超像素分割?”

所謂超像素分割,指的是將數(shù)字圖像細(xì)分為多個圖像子區(qū)域(像素的集合)(也被稱作超像素)的過程。超像素是由一系列位置相鄰且顏色、亮度、紋理等特征相似的像素點組成的小區(qū)域。這些小區(qū)域大多保留了進(jìn)一步進(jìn)行圖像分割的有效信息,且一般不會破壞圖像中物體的邊界信息。

超像素分割的結(jié)果是圖像上子區(qū)域的集合(這些子區(qū)域的全體覆蓋了整個圖像),或是從圖像中提取的輪廓線的集合(例如邊緣檢測)。如果能把技術(shù)用在圖像標(biāo)注上,不僅標(biāo)注精度將會大大提高,標(biāo)注對象邊緣將會更加精確清晰,標(biāo)注時間也將大大壓縮。最重要的是,完成這種精度的標(biāo)注,完全不需要再借助PS等圖像處理工具,將有更多標(biāo)注員有機(jī)會參與進(jìn)來,完成這項任務(wù)也就不再困難。

大家會心一笑,方案找到了意味著:可以加班了。所有人都意識到這兩天將是特別難熬的兩天,但黎明前最黑暗,這也是創(chuàng)造標(biāo)注“歷史”的時刻。為了趕工期,技術(shù)的同事通宵達(dá)旦,設(shè)計標(biāo)注標(biāo)簽、像素區(qū)塊畫筆,設(shè)置畫筆大小范圍、提供接口……一步步有條不紊的進(jìn)行著,兩天兩夜?jié)M滿的工作后,終于在第三天,測試工程師在群里告訴大家:標(biāo)注新功能上線,超像素分割,歡迎使用。

產(chǎn)品笑了,運營忙了,技術(shù)睡了。

  寒冬里的一把火:上萬標(biāo)注員因此獲益

創(chuàng)新引領(lǐng)發(fā)展,龍貓數(shù)據(jù)用新技術(shù)賦能AI贏取未來

采用了超像素分割標(biāo)注方法之后,原來那么多彎折的曲線再也不用挨個打點連線,簡單的涂涂畫畫就標(biāo)注完了。對于標(biāo)注員來說,最直觀的提升是工作的趣味性,“秘密花園這個游戲你玩過沒有,現(xiàn)在標(biāo)注就像是玩這個游戲,把對象選出來涂上不同的顏色,比起枯燥的打點有意思多了,你們怎么不早上線這個功能呢?”標(biāo)準(zhǔn)員小穎笑著說道。

甲方覺得一周的時間也確實有些短,但沒想到的是龍貓數(shù)據(jù)竟然提前一天“交了卷”,看著標(biāo)注的圖像,他們驚訝的說,“你們是怎么做到的?全景圖標(biāo)的這么細(xì)致,比我們要求的精度還要高,邊緣處理的也更好,真沒想到可以達(dá)到這種效果,我都能想到我們的AI工程師看到這些圖開心的表情了!”

客戶還表示,有了這樣的產(chǎn)出質(zhì)量和效率,他們就可以投入更多在產(chǎn)品研發(fā)和落地上,以后將要采集標(biāo)注的數(shù)據(jù)也會更多,無論是對數(shù)據(jù)服務(wù)行業(yè)還是對整個AI產(chǎn)業(yè),都將起到相當(dāng)大的推動作用。

超像素分割不僅提升了標(biāo)注的質(zhì)量,實現(xiàn)了打點連線標(biāo)注無法達(dá)到的精度,更是極大提升了標(biāo)注效率,小穎介紹說,之前用打點實現(xiàn)的標(biāo)注效果,現(xiàn)在用新技術(shù)標(biāo)注,在一半不到的時間里,就可以實現(xiàn)比之前更好的效果。如果用PS等工具進(jìn)行標(biāo)注,需要的時間往往比打點還要高。

“之前看他們會使用圖像處理軟件進(jìn)行標(biāo)注的很羨慕,但太復(fù)雜,也學(xué)不來”,春亮說,“現(xiàn)在那些精細(xì)標(biāo)注的高額任務(wù)我終于也能領(lǐng)了,并且完成的比他們還好還快,自己的收入有了明顯的提升。”

據(jù)保守估計,超像素分割降低了圖像標(biāo)注工作門檻之后,將有數(shù)萬人因此獲益,成為“一切圖像皆可標(biāo)”的“萬能標(biāo)注員”。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-01-09
創(chuàng)新引領(lǐng)發(fā)展,龍貓數(shù)據(jù)用新技術(shù)賦能AI贏取未來
互聯(lián)網(wǎng)之“冷”與人工智能之“熱”10月中旬以來,多家互聯(lián)網(wǎng)知名公司被曝出大規(guī)模裁員消息,不管是以“業(yè)

長按掃碼 閱讀全文