抓取數(shù)據(jù)可能會吃官司?請看好你家的爬蟲!

歷時兩年的微博與脈脈之爭終于有了結(jié)果:法院認(rèn)定脈脈非法抓取、使用微博用戶信息行為構(gòu)成不正當(dāng)競爭,一審判決脈脈停止不正當(dāng)競爭行為,并賠償原告經(jīng)濟損失等220余萬元。兩年前我有關(guān)注到微博與脈脈的數(shù)據(jù)之爭,這在口水戰(zhàn)每天都發(fā)生的互聯(lián)網(wǎng)圈本來不算什么大事。但這次法院判決結(jié)果,還是挺出人意料的。毫不夸張地說,這一事件給互聯(lián)網(wǎng)公司敲響了關(guān)于用戶數(shù)據(jù)保護的警鐘。

一個常規(guī)的數(shù)據(jù)抓取糾紛

先簡單說一下微博和脈脈之爭的來龍去脈。

2014年8月公開鬧掰:微博宣布停止脈脈使用的微博開放平臺所有接口,理由是“脈脈通過惡意抓取行為獲得并使用了未經(jīng)微博用戶授權(quán)的檔案數(shù)據(jù),違反微博開放平臺的開發(fā)者協(xié)議”。與此同時,脈脈宣布終止支持微博登錄,并通過一些郵件截圖曝光微博此舉,是因其投資脈脈不成,索要脈脈用戶關(guān)系數(shù)據(jù)受阻后的報復(fù)。就像所有口水戰(zhàn)一樣,雙方各執(zhí)一詞、真相撲朔迷離。

2015年3月對簿公堂:微博主體公司于2015年3月將脈脈主體公司告上法庭,微博脈脈之爭升級。

微博起訴理由主要有脈脈非法獲取和使用微博信息,商業(yè)詆毀等。

在用戶微博登錄脈脈并上傳個人通訊錄之后,大量非脈脈用戶的微博頭條、昵稱、職業(yè)、教育等信息出現(xiàn)在脈脈上,這些信息并不在微博OPEN API之中,并且在微博停止脈脈所有接口權(quán)限之后,脈脈依然進行了相關(guān)數(shù)據(jù)抓取,微博認(rèn)為脈脈通過非法手段獲取信息。除此之外,微博認(rèn)為在雙方“鬧掰”之后脈脈發(fā)表的公開言論對微博商譽構(gòu)成了詆毀,脈脈采取了類似于微博加V認(rèn)證的機制和界面設(shè)計,構(gòu)成不正當(dāng)競爭。

法院認(rèn)定,脈脈繞過OPEN API抓取數(shù)據(jù)的行為,危害到微博用戶信息安全,損害了微博合法競爭利益,對其構(gòu)成不正當(dāng)競爭,商業(yè)詆毀成立,判決脈脈停止不正當(dāng)競爭行為,并賠償原告經(jīng)濟損失等220余萬元。

類似訴訟在互聯(lián)網(wǎng)行業(yè)屢見不鮮。

2013年,百度因奇虎360違背Robots協(xié)議抓取復(fù)制百科等內(nèi)容構(gòu)成不正當(dāng)競爭,起訴后者并索賠1億元。

2016年2月,因認(rèn)為百度視頻通過抓取播放窗口的方式,嵌套樂視網(wǎng)視頻資源到百度視頻客戶端,屏蔽了樂視網(wǎng)網(wǎng)頁、網(wǎng)址、廣告,造成公眾混淆,構(gòu)成不正當(dāng)競爭,樂視起訴百度并索賠100萬元。

2016年4月,大眾點評訴百度旗下的百度地圖及百度知道大量復(fù)制其用戶點評等信息,構(gòu)成不正當(dāng)競爭,提出9000萬元索賠要求。

這些案例均是某平臺因內(nèi)容被抓取起訴抓取方,在數(shù)據(jù)為核心資產(chǎn)之一的互聯(lián)網(wǎng)產(chǎn)業(yè),“數(shù)據(jù)糾紛”只會越來越多。

平臺用戶數(shù)據(jù)受法律保護

從法院一審的判決邏輯來看,是否保護用戶信息已成數(shù)據(jù)糾紛中的法律準(zhǔn)繩。

海淀法院在“世界知識產(chǎn)權(quán)日”公開宣判這一案件,或許不是巧合。其明確表示,

“大數(shù)據(jù)時代,保護用戶信息是衡量經(jīng)營者行為正當(dāng)性的重要依據(jù),也是反不正當(dāng)競爭法意義上尊重消費者權(quán)益的重要內(nèi)容?!?/p>

這表明,用戶權(quán)益被擺在最優(yōu)先位置。

在“人肉”這類網(wǎng)絡(luò)暴力頻發(fā)、用戶資料屢屢泄露的大環(huán)境下,這一判決具有示范意義。平臺在業(yè)務(wù)設(shè)計上必須充分考慮用戶信息保護,確保用戶信息不被濫用,隱私數(shù)據(jù)不遭泄露,同時確保用戶對個人信息的使用有知情權(quán)。

在保護用戶利益之后,才是平臺利益。

值得注意的是,用戶信息與用戶數(shù)據(jù)并不是一回事,比如你在微信公眾賬號發(fā)的文章,算是用戶數(shù)據(jù),但你個人微信昵稱、頭像這些資料,才算是用戶信息。但究竟哪些屬于用戶隱私則很難說,你上傳到平臺的照片肯定是隱私數(shù)據(jù),但你發(fā)的公開微博就不一定了。那么,不具備“個人隱私”屬性的數(shù)據(jù)是否受法律保護呢?如果有人繞過接口,抓取用戶發(fā)的微博而不是個人信息,會有不同的結(jié)果嗎?

這里有一個案例:百度起訴360違反Robots協(xié)議抓取知道、百科等數(shù)據(jù)的糾紛就是這樣的情況,法院尊重Robots協(xié)議和平臺對UGC數(shù)據(jù)的權(quán)益,360被判賠償百度70萬元。就是說,UGC內(nèi)容的創(chuàng)建者是誰并不重要,搭建平臺網(wǎng)站投入運營、技術(shù)和人力成本,擁有對數(shù)據(jù)的使用權(quán)和分發(fā)權(quán)。如果第三方網(wǎng)站違背意愿進行抓取,就可能被判為不正當(dāng)競爭。

數(shù)據(jù)是互聯(lián)網(wǎng)公司的核心資產(chǎn),不論是個人信息還是UGC數(shù)據(jù)(微博、文章、點評等),所有這些平臺數(shù)據(jù)都將受到法律保護,平臺對這些數(shù)據(jù)擁有所有權(quán)、使用權(quán)和分發(fā)權(quán)。

互聯(lián)網(wǎng)公司應(yīng)提防數(shù)據(jù)糾紛

互聯(lián)網(wǎng)公司想要利用別家平臺的數(shù)據(jù)時,必須遵循對方的公共API協(xié)議,或Robots爬蟲協(xié)議,抑或通過正式協(xié)議合作。數(shù)據(jù)受法律保護?;ヂ?lián)網(wǎng)公司不能違背某平臺意愿抓取其數(shù)據(jù)——在技術(shù)上或許并不難,可通過爬蟲等手段繞過限制,實現(xiàn)數(shù)據(jù)抓取,但這樣做很可能會吃官司,并且敗訴幾率相當(dāng)高。

因為數(shù)據(jù)抓取糾紛而對簿公堂的案例還不算多,但數(shù)據(jù)抓取行為在互聯(lián)網(wǎng)行業(yè)卻很常見,比如許多平臺都能看到豆瓣電影評分?jǐn)?shù)據(jù),再比如一些導(dǎo)購網(wǎng)站聚合了電商平臺的評論,還有平臺將微信公眾賬號所有文章都聚集起來…這些行為理論上來說都有數(shù)據(jù)糾紛的風(fēng)險,如果你做得不夠大平臺一般也沒這個精力理你,但萬一你某天做到了呢?況且,很多大公司也這樣干。

對于數(shù)據(jù)的獲取和使用,不再是一個技術(shù)問題、商業(yè)問題、道德問題,而是一個法律問題,所以,請看好你家的爬蟲。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-04-29
抓取數(shù)據(jù)可能會吃官司?請看好你家的爬蟲!
歷時兩年的微博與脈脈之爭終于有了結(jié)果:法院認(rèn)定脈脈非法抓取、使用微博用戶信息行為構(gòu)成不正當(dāng)競爭,一審判決脈脈停止不正當(dāng)競爭行為,并

長按掃碼 閱讀全文