數(shù)據(jù)需要治理!全球頂級(jí)大咖匯集SDBD2020探討數(shù)據(jù)共享最新實(shí)踐

8月25日,SIGKDD·SDBD2020 第二屆智能數(shù)據(jù)和區(qū)塊鏈應(yīng)用國(guó)際研討會(huì)在線召開(kāi),在數(shù)據(jù)經(jīng)濟(jì)大背景下探討數(shù)據(jù)治理與共享之道。

ACM SIGKDD2020(知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘會(huì)議)是一年一度全球最頂級(jí)、最高水平、最具影響力的數(shù)據(jù)科學(xué)盛會(huì),本次SDBD國(guó)際研討會(huì)作為KDD大會(huì)中聚焦智能數(shù)據(jù)和區(qū)塊鏈等新興技術(shù)的專(zhuān)場(chǎng)Workshop,由新加坡管理大學(xué)及算力智庫(kù)共同舉辦。

算力智庫(kù)創(chuàng)始人燕麗表示:“今年國(guó)家把數(shù)據(jù)提到生產(chǎn)要素的高度,標(biāo)志著行業(yè)風(fēng)口的到來(lái)。算力智庫(kù)一直在跟蹤智能數(shù)據(jù)、隱私計(jì)算和區(qū)塊鏈賽道中的好公司、好應(yīng)用,希望通過(guò)第一手原創(chuàng)深度報(bào)道和研報(bào)推進(jìn)產(chǎn)業(yè)與生態(tài)的發(fā)展。”

會(huì)上,來(lái)自全球的學(xué)界與產(chǎn)業(yè)界專(zhuān)家從數(shù)據(jù)作為資產(chǎn)的維度探討了前沿科技賦能數(shù)據(jù)共享的最新實(shí)踐,并倡導(dǎo)“技術(shù)+制度”雙軌并行充分挖掘數(shù)據(jù)要素的更大價(jià)值。

1數(shù)據(jù)治理是數(shù)字經(jīng)濟(jì)前提

人工智能、區(qū)塊鏈等科技讓數(shù)據(jù)成為了智慧數(shù)據(jù),但所謂數(shù)據(jù)經(jīng)濟(jì)則不止于智慧數(shù)據(jù)。新加坡管理大學(xué)教授朱飛達(dá)認(rèn)為,在談?wù)摽萍既绾巫寯?shù)據(jù)變得“可計(jì)算”之前,還必須認(rèn)識(shí)到一個(gè)前提——數(shù)據(jù)是資產(chǎn),數(shù)據(jù)需要治理。

然而即便是這樣一個(gè)大前提,人類(lèi)也花費(fèi)了很長(zhǎng)時(shí)間才認(rèn)識(shí)到。朱飛達(dá)教授表示,數(shù)據(jù)經(jīng)濟(jì)歷經(jīng)了三個(gè)階段。第一階段數(shù)據(jù)只是商業(yè)活動(dòng)的副產(chǎn)品,人們更多用數(shù)據(jù)來(lái)理解過(guò)去。第二階段是大數(shù)據(jù)與數(shù)據(jù)經(jīng)濟(jì)的興起,在這一階段數(shù)據(jù)被少部分企業(yè)壟斷而得利。第三階段則是數(shù)據(jù)驅(qū)動(dòng)經(jīng)濟(jì),數(shù)據(jù)成為了驅(qū)動(dòng)所有機(jī)構(gòu)組織的共享資產(chǎn)。

翼方健數(shù)(BaseBit.a(chǎn)i) CEO羅震認(rèn)為,從信息時(shí)代到智能時(shí)代,數(shù)據(jù)正在更多被機(jī)器和計(jì)算程序使用,也讓機(jī)器更加智能化。作為信息時(shí)代的遺留物,數(shù)據(jù)具有獨(dú)特的經(jīng)濟(jì)學(xué)特征,如虛擬可再利用、固定成本高、可變成本低,同時(shí)也在隱私、合規(guī)、機(jī)密、安全性等非經(jīng)濟(jì)學(xué)維度顯示出鮮明特征。

事實(shí)上,人們?cè)谡J(rèn)識(shí)這些數(shù)據(jù)特性的過(guò)程中已經(jīng)付出了代價(jià),缺乏治理的數(shù)據(jù)泄露案例造成巨大損失。

新加坡國(guó)立大學(xué)副教授何丙勝表示,數(shù)據(jù)泄露已非孤立事件,各行業(yè)都有相關(guān)事件。在教育、醫(yī)藥、能源、健康等領(lǐng)域,每一起數(shù)據(jù)泄露事件造成的平均損失都至少在500萬(wàn)美元以上。

這些負(fù)面案例不僅承載了巨大的經(jīng)濟(jì)損失,更消耗了整個(gè)社會(huì)對(duì)數(shù)據(jù)共享的意愿和信心,讓本就基礎(chǔ)薄弱的數(shù)據(jù)共享愈加困難。

羅震指出,數(shù)據(jù)本質(zhì)上不能被安全共享,但應(yīng)該在不共享數(shù)據(jù)本身的前提下實(shí)現(xiàn)數(shù)據(jù)價(jià)值共享。

當(dāng)然這就更難,最著名的阻礙就是數(shù)據(jù)孤島。何丙勝教授以醫(yī)院數(shù)據(jù)為例表示,不同的醫(yī)院有不同的病人,但其實(shí)病例有許多相似性。醫(yī)院、銀行、電商,他們各自的數(shù)據(jù)實(shí)際上是分別掌握了相同人群的不同方面。

朱飛達(dá)教授的研究發(fā)現(xiàn),數(shù)據(jù)生態(tài)系統(tǒng)中存在兩大瓶頸。第一大瓶頸存在于個(gè)人、企業(yè)、政府等不同角色間。第二大瓶頸存在于數(shù)據(jù)、模型和應(yīng)用間。

在個(gè)人與企業(yè)間,用戶作為數(shù)據(jù)的貢獻(xiàn)者不僅被排除在價(jià)值分配之外,對(duì)自身數(shù)據(jù)的認(rèn)知與控制也十分有限,更要承受隱私泄露風(fēng)險(xiǎn)。個(gè)人與政府間則存在隱私與數(shù)據(jù)泄露的擔(dān)憂。政府部門(mén)間因制度原因存在“數(shù)據(jù)高墻”,企業(yè)之間數(shù)據(jù)孤島現(xiàn)象普遍,在企業(yè)與政府間數(shù)據(jù)共享缺乏激勵(lì)。

另外,在數(shù)據(jù)端,數(shù)據(jù)來(lái)源不明,質(zhì)量差;在模型端,模型的設(shè)計(jì)與訓(xùn)練難以獲取真實(shí)用戶數(shù)據(jù);在應(yīng)用端,缺少先進(jìn)的模型造成了低層次的數(shù)據(jù)智能。

朱飛達(dá)教授認(rèn)為,問(wèn)題的根源并不在于數(shù)據(jù)智能本身,而在于數(shù)據(jù)治理。數(shù)據(jù)資產(chǎn)治理的核心要素是信任+激勵(lì)。其中,信任可以通過(guò)聯(lián)邦學(xué)習(xí)、差分隱私、安全多方計(jì)算、TEE等來(lái)實(shí)現(xiàn),而激勵(lì)則通過(guò)數(shù)據(jù)定價(jià)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、通證經(jīng)濟(jì)等來(lái)實(shí)現(xiàn)。

123下一頁(yè)>

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2020-08-26
數(shù)據(jù)需要治理!全球頂級(jí)大咖匯集SDBD2020探討數(shù)據(jù)共享最新實(shí)踐
8月25日,SIGKDD·SDBD2020 第二屆智能數(shù)據(jù)和區(qū)塊鏈應(yīng)用國(guó)際研討會(huì)在線召開(kāi),在數(shù)據(jù)經(jīng)濟(jì)大背景下探討數(shù)據(jù)治理與共享之道。

長(zhǎng)按掃碼 閱讀全文