互聯(lián)網(wǎng)之“冷”與人工智能之“熱”
10月中旬以來,多家互聯(lián)網(wǎng)知名公司被曝出大規(guī)模裁員消息,不管是以“業(yè)務(wù)調(diào)整”為借口,還是以“人員優(yōu)化”為理由,互聯(lián)網(wǎng)行業(yè)就業(yè)景氣程度大不如前是不爭的事實。根據(jù)《中國就業(yè)市場景氣報告》顯示,今年第三季度的招聘需求人數(shù)與去年同期相比下降了27%,出現(xiàn)了八年來的首次下降。
在互聯(lián)網(wǎng)就業(yè)市場一片陰冷之中,人工智能卻成為了最火的熱詞,從政府工作報告到行業(yè)峰會大會,再到技術(shù)應(yīng)用落地,我們見證了人工智能引領(lǐng)變革、帶來生機的一次次驚艷表現(xiàn)。人工智能專業(yè)應(yīng)屆生動輒50萬的年薪刺激著無數(shù)人的神經(jīng),而在人工智能光鮮一面的背后,作為算法優(yōu)化過程的重要一環(huán)——數(shù)據(jù)標注,目前全職從業(yè)者已達到10萬,兼職人群的規(guī)模更是接近100萬。
截至2018年6月,全球人工智能企業(yè)已達5000余家,中國占據(jù)五分之一之多。AI企業(yè)的核心要素除了算法便是精準標注過的數(shù)據(jù),這也催生了中國大量標注公司、標注團隊出現(xiàn)。據(jù)不完全統(tǒng)計,除去人工智能巨頭本身擁有的數(shù)據(jù)標注團隊,國內(nèi)專業(yè)的數(shù)據(jù)標注公司超過50余家,大大小小的外包團隊超過500家,AI的火熱可見一斑。
精度、效率與門檻:圖像標注業(yè)身上的“三座大山”
數(shù)據(jù)標注的精準性對算法優(yōu)化結(jié)果起到了決定性作用,這就要求數(shù)據(jù)標注必須高質(zhì)量完成。而產(chǎn)品研發(fā)的緊迫性、行業(yè)競爭的白熱化決定了標注數(shù)據(jù)的產(chǎn)出必須極其關(guān)注效率,可能一次數(shù)據(jù)標注的拖延就將導致產(chǎn)品上市的滯后,造成競爭力下降,甚至直接危及初創(chuàng)企業(yè)的生死存亡。
在圖像標注領(lǐng)域,擁有自主標注平臺的數(shù)據(jù)服務(wù)公司本身就不多,而目前國內(nèi)圖像標注平臺普遍采用的還是兩種標注方式:打點連線和PS技術(shù)。打點連線就是沿著要標注的物體邊沿打上足夠多的點,然后通過連成線標注出對象輪廓。這一方式門檻低但極其繁瑣,只適用于交通線等直線標注標注效果也不夠理想。另一方式是通過PS等畫面處理技術(shù)標注,準入門檻較高,只有深度掌握PS等繪圖技術(shù)才能夠進行,標注時間和人力成本高,且導出格式單一,達不到客戶要求,成為制約圖像標注時效和質(zhì)量的一大瓶頸,也成為普通數(shù)據(jù)標注員的一大心病:明明有標注任務(wù)和需求,卻因為難以掌握相關(guān)技能而失之交臂。
如何在降低標注成本的前提下提升標注精度和效率,不僅成為標注行業(yè)本身的一塊心病,也成為整個AI產(chǎn)業(yè)發(fā)展的制約。可以說,誰能夠突破制約,找到解決之道,誰就能在激烈的標注業(yè)競爭中站穩(wěn)腳跟,實現(xiàn)長足發(fā)展。
臨危受命:他們遇到標注以來最大挑戰(zhàn)
普通標注:邊緣處理較困難,精度低
作為數(shù)據(jù)采集和標注領(lǐng)域的領(lǐng)軍企業(yè),北京安捷智合科技有限公司(龍貓數(shù)據(jù))在AI發(fā)展中積累了大量經(jīng)驗,服務(wù)過超過100家的AI大型公司,累計提供行業(yè)解決方案超500個,并自主建立起國內(nèi)第一個數(shù)據(jù)+算力的AI綜合服務(wù)平臺,為AI發(fā)展做出了突出貢獻。
然而任何企業(yè)的發(fā)展都不可能一帆風順,特別是正在快速成長期的公司。就在前不久,龍貓數(shù)據(jù)遇到了開展數(shù)據(jù)標注業(yè)務(wù)以來最大的挑戰(zhàn)。某客戶為了產(chǎn)品能夠趕在競品之前上市,要求龍貓數(shù)據(jù)在一周內(nèi)為他們提供超過5萬張的精細標注圖,內(nèi)容涵蓋汽車、道路、自然風景、人臉等多個項目,且標注精度要求極其高,標注圖像的邊緣必須達到PS標注級別。
如果只是小批量標注,或許還可以找到足夠多懂得PS技術(shù)的人來完成任務(wù)。但面對如此大的需求量,面對如此緊迫的任務(wù)周期,就連龍貓經(jīng)驗豐富的項目經(jīng)理也感受到了巨大的壓力。“用PS肯定標不完的,人不夠,時間也不夠”,這是出于經(jīng)驗的判斷。他們馬上找了一批打點標注的人進行精細標注,想通過更多人參與解決問題。
標注結(jié)果剛傳到客戶手里就馬上引來不滿,“這樣的標注怎能達到我們的要求?你們還想不想繼續(xù)合作?”
化壓力為動力,從創(chuàng)新處找答案
超像素分割標注:精準,高效,簡單,
面對客戶的高標準嚴要求,有些人打起了退堂鼓。“要不這項目我們不做了?我們有那么多項目,這個不做我們也沒什么損失”。在產(chǎn)品、技術(shù)、運營的聯(lián)合會議上,負責人明確告訴大家:“這項目我們必須做,哪怕花再大代價,我們也要讓客戶滿意,這是龍貓一直堅持的信念!再說這個我們不做,國內(nèi)恐怕也沒有第二家能夠按要求做出來”。
負責人的態(tài)度感染了每一個人。大家都在努力想辦法,但按照目前的現(xiàn)實情況,想要實現(xiàn)承諾真是天方夜譚。產(chǎn)品團隊在會后進行頭腦風暴,集思廣益尋找思路。但囿于國內(nèi)標注現(xiàn)狀,大家想的還是傳統(tǒng)的解決方法,很難從根本上解決問題。
這時候,團隊的一名“老隊員”——他在公司成立半年后就來這兒工作了,說道“要不我們考慮下超像素分割?”
所謂超像素分割,指的是將數(shù)字圖像細分為多個圖像子區(qū)域(像素的集合)(也被稱作超像素)的過程。超像素是由一系列位置相鄰且顏色、亮度、紋理等特征相似的像素點組成的小區(qū)域。這些小區(qū)域大多保留了進一步進行圖像分割的有效信息,且一般不會破壞圖像中物體的邊界信息。
超像素分割的結(jié)果是圖像上子區(qū)域的集合(這些子區(qū)域的全體覆蓋了整個圖像),或是從圖像中提取的輪廓線的集合(例如邊緣檢測)。如果能把技術(shù)用在圖像標注上,不僅標注精度將會大大提高,標注對象邊緣將會更加精確清晰,標注時間也將大大壓縮。最重要的是,完成這種精度的標注,完全不需要再借助PS等圖像處理工具,將有更多標注員有機會參與進來,完成這項任務(wù)也就不再困難。
大家會心一笑,方案找到了意味著:可以加班了。所有人都意識到這兩天將是特別難熬的兩天,但黎明前最黑暗,這也是創(chuàng)造標注“歷史”的時刻。為了趕工期,技術(shù)的同事通宵達旦,設(shè)計標注標簽、像素區(qū)塊畫筆,設(shè)置畫筆大小范圍、提供接口……一步步有條不紊的進行著,兩天兩夜?jié)M滿的工作后,終于在第三天,測試工程師在群里告訴大家:標注新功能上線,超像素分割,歡迎使用。
產(chǎn)品笑了,運營忙了,技術(shù)睡了。
寒冬里的一把火:上萬標注員因此獲益
采用了超像素分割標注方法之后,原來那么多彎折的曲線再也不用挨個打點連線,簡單的涂涂畫畫就標注完了。對于標注員來說,最直觀的提升是工作的趣味性,“秘密花園這個游戲你玩過沒有,現(xiàn)在標注就像是玩這個游戲,把對象選出來涂上不同的顏色,比起枯燥的打點有意思多了,你們怎么不早上線這個功能呢?”標準員小穎笑著說道。
甲方覺得一周的時間也確實有些短,但沒想到的是龍貓數(shù)據(jù)竟然提前一天“交了卷”,看著標注的圖像,他們驚訝的說,“你們是怎么做到的?全景圖標的這么細致,比我們要求的精度還要高,邊緣處理的也更好,真沒想到可以達到這種效果,我都能想到我們的AI工程師看到這些圖開心的表情了!”
客戶還表示,有了這樣的產(chǎn)出質(zhì)量和效率,他們就可以投入更多在產(chǎn)品研發(fā)和落地上,以后將要采集標注的數(shù)據(jù)也會更多,無論是對數(shù)據(jù)服務(wù)行業(yè)還是對整個AI產(chǎn)業(yè),都將起到相當大的推動作用。
超像素分割不僅提升了標注的質(zhì)量,實現(xiàn)了打點連線標注無法達到的精度,更是極大提升了標注效率,小穎介紹說,之前用打點實現(xiàn)的標注效果,現(xiàn)在用新技術(shù)標注,在一半不到的時間里,就可以實現(xiàn)比之前更好的效果。如果用PS等工具進行標注,需要的時間往往比打點還要高。
“之前看他們會使用圖像處理軟件進行標注的很羨慕,但太復雜,也學不來”,春亮說,“現(xiàn)在那些精細標注的高額任務(wù)我終于也能領(lǐng)了,并且完成的比他們還好還快,自己的收入有了明顯的提升。”
據(jù)保守估計,超像素分割降低了圖像標注工作門檻之后,將有數(shù)萬人因此獲益,成為“一切圖像皆可標”的“萬能標注員”。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 新能源車技術(shù)升級搶先看,ChatGPT崩了引熱議:未來科技如何破局?
- 自動駕駛行業(yè)大洗牌即將結(jié)束,小馬智行引領(lǐng)千臺車隊新篇章
- 微軟反壟斷風暴:Office捆綁銷售引質(zhì)疑,云服務(wù)策略遭調(diào)查,巨頭陷困境
- 顯卡漲價風暴來襲!NVIDIA/AMD緊急應(yīng)對,全力加速生產(chǎn)運回本土
- 微軟新目標:用1000億美元打造實用通用AI,未來可期但需謹慎
- 亞馬遜云科技陳曉建預測:未來三年內(nèi),生成式AI將引發(fā)云市場新革命
- 林肯中國辟謠:財務(wù)調(diào)整非合并,業(yè)務(wù)不變穩(wěn)如泰山
- 字節(jié)跳動研發(fā)大手筆:2024年投入接近BAT之和,能否引領(lǐng)中國OpenAI新潮流?
- 跨境匯款平臺新舉措:螞蟻集團開發(fā)者服務(wù)限每日10萬美元,助力全球交易更便捷
- 我國充電樁建設(shè)提速,50%增長背后的高速服務(wù)區(qū)充電新篇章
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。