復旦大學鄭磊:公共數據開放存在四大問題,建議面向場景開放

5月27日消息(南山)在昨日舉辦的“2022中國國際大數據產業(yè)博覽會”之場景大數據論壇上,復旦大學數字與移動治理實驗室主任、國際關系與公共事務學院教授、博導鄭磊發(fā)表演講,暢談了公共數據開放面臨的主要問題,并提出了“面向場景開放”的建議。

鄭磊指出,加快數字化發(fā)展、建設數字中國,需要激活數據要素潛能,加快三個方面建設,即:數字經濟、數字社會、數字政府。公共數據開放是其中的關鍵一環(huán),根據復旦大學數字與移動治理實驗室的報告研究,我國2012年僅有3個地方政府上線了政府數據開放平臺,到2021年提升至193個,其中省級20個,發(fā)展速度很快。

但是,報告中仍然發(fā)現了一些問題,主要體現在以下四個方面:

第一,不充分。目前全國地級、副省級和省級開放平臺仍然只占全國覆蓋率一半,還有一半的地級、副省級和省加一起沒有上線數據開放平臺。在已經上線這些平臺,開放的數據在數量上還相對比較少,容量比較低。也就是說數據級打開了以后,里面字段和條數低,俗稱容量低,顆粒度比較粗,開放的質量也較差。政府數據以外的公共數據開放不充分,現在更多看到的是政府數據,但是還有高價值的數據,比如國有企事業(yè)單位,特別是水電煤公共設施、交通、氣象機構開放的數據,也在公共數據的范疇里面,但是這一類數據開放不充分。

第二,不平衡。開放數據數量、開放數據級的數量、平臺數量還有數據的容量在各個地區(qū)之間分布不平衡。有一些地區(qū)做比較好,還有地區(qū)相對比較弱,開放方式也不平衡,現在以普遍性的無條件開放數據比較多。但是無條件開放在平臺上誰都可以下載數據,相對來說價值不高,顆粒度不細。真正高價值數據也是相對敏感數據,這一類數據現在一般通過有條件開放或者授權運營的方式開放給社會,但是這一類開放方式目前還比較少見或者沒有真正的開展這方面工作,更多是普遍開放或者無條件開放。開放數據的主體領域,如:交通、氣象、衛(wèi)生主體領域之間分布不均衡,有一些領域全國開放相對好,有一些領域開放弱。參與開放的委辦局部門分布不平衡,有一些部門參與程度比較深,開放數據多。但是也有一些地方某一些類型部門,或者總體上在全國有一些條件部門開放數據不多,所以在部門之間分布仍然不平衡。地區(qū)之間的利用水平也不平衡,有一些地方對于數據的利用程度相對高,開發(fā)出了各種應用。但是有一些地方比較弱,基本上沒有看到真正基于數據開放以后所產生的利用成果。利用主體和利用成果分布不平衡,利用主體主要體現在企業(yè)上,但是其他的社會組織對于數據的利用不充分。包括成果本身也集聚在某一些領域,但是其他的領域相對成果少,這個主要是不平衡的問題。

第三,不協同。開放數據平臺無論是橫向的跨地域平臺,還是縱向跨層級平臺,包括省和地市之間關系,這些平臺沒有聯通,更多看到是碎片化的孤立平臺。有一些地方省級平臺包括下屬的地市,這些地方整合度高。但是仍然有很多地方省級平臺或者地市級平臺,或者地市平臺之間都沒有互相聯通。即使有一些平臺聯通了之后,可以發(fā)現在這些平臺上開放數據內容,它的主題、數據集的名稱以及開放的數據集即使名稱一樣,開放字段標準、顆粒度的標準都不一樣。如果到兩個地方看他們數據集,會發(fā)現數據集開放上有A省開放數據,B省沒有開放;或者B省開放的數據,A省沒有開放;或者A和B省都開放這類數據,但是開放的數據標準不同。比如有的地方以日為單位開放,有的地方以月為單位開放;有的地方開放這個字段,有的地方沒有開放這個字段。即使發(fā)現兩個地方的數據級內容是一樣,標準對不上,就沒有辦法把這個數據放在一起融合利用,特別是跨層級和跨地域上問題表現非常明顯。利用成果也是跨地域之間不協同,我們看到基于某一個城市開發(fā)了一個應用,但是這個應用只用了這個城市數據,到另外一個城市沒有這樣的應用。這個應用只是基于本地數據開發(fā),為什么這個應用沒有用其他地方數據?主要的原因并不是應用時沒有想到要去用其他地方數據,而是同樣的數據在這個地方開放了,在另外一個地方沒有開放。所以這個應用不可能成為跨地區(qū)應用,因為其他地區(qū)同樣的數據沒有開放出來。這也是數據利用成果的跨地區(qū)不協同。

第四,不可持續(xù)。主要體現在:平臺運營服務不穩(wěn)定。把平臺作為建設項目,把平臺建設開發(fā)完后上線,后面并沒有穩(wěn)定的團隊運營平臺。有一些企業(yè)或者團隊、社會組織向平臺提出數據需求,說需要這樣的數據或者提出建議,或者有一些糾錯,發(fā)現這個數據有錯誤,想反饋給平臺,發(fā)現平臺完全沒有回應。就是說平臺只是一個建設項目,不是常態(tài)化服務的運營平臺,后面沒有團隊長期提供服務,可能有團隊做技術運維,但是并沒有團隊在做服務運營,所以這方面不穩(wěn)定。這樣的話,老百姓或者企業(yè)在平臺上進行各種互動沒有得到回應的話,這個平臺就不可持續(xù)。另外平臺上雖然有一些數據開放出來了,但是數據更新不及時,有一些是幾年前的數據,真正有價值的數據應該是實時動態(tài)更新的,如果這一點做不到,也是不可持續(xù)的平臺。還有就是數據利用促進活動沒有實現常態(tài)化??赡芨鞯囟冀M織了大賽,看到很多地方都組織大賽,但是大賽有的時候一年搞一次,有時候搞一次后來沒有了。就算一年搞一次,比賽完了以后,日常利用促進活動就沒有了,并沒有實現常態(tài)化。

整體而言,開放一側的政府機構和利用方包括企業(yè)和團隊、科研機構,在供需之間沒有形成價值的共創(chuàng)閉環(huán),需方找不到供方,供方只管放上自己認為大家需要的數據,沒有思考過需方需要什么數據;或者需方提出需求,供方完全不知道,或者根本沒有回應,沒有運維平臺。供需雙方沒有形成對接,這邊開放了很多數據,但是大家真正要的數據沒有開放;這邊不斷提出需求,但是找不到門路拿到他想要的公共數據。

怎么解決上述問題?

鄭磊介紹,數據開放早期存在一個“默認開放原則”,凡是不可以開放,涉及到安全、個人信息保護、商業(yè)機密的數據不能開放,其他數據可以開放。這個模式聽起來理想,但真正推進的時候效果并不理想。開放的數據不是別人要的,別人要的數據沒有開放。全球漸漸都在思考這個問題:有目標地開放數據。

鄭磊探討了面向場景的開放?;氐礁唧w更加接地氣、更可操作目標,比如交通場景、氣象場景、普惠金融場景等,釋放高價值數據的潛力。鄭磊進一步認為,數字經濟、數字社會、數字政府,就是三大場景,然后在三大場景下細分具體的小場景。

例如數字社會,十四五規(guī)劃關于數字社會這一章的話:“要聚焦教育、醫(yī)療、養(yǎng)老、婦幼、就業(yè)、文體、助殘等重點領域,推動數字化服務普惠應用”,那么這些就是具體的應用場景。鄭磊建議,政府一方面可以自己開發(fā)普惠類應用,另一方面可以開放給市場,結合企業(yè)和社會已有數據,創(chuàng)造更好的普惠應用。數字社會服務模式和產品創(chuàng)新提供,需要社會力量參與,地方政府需要在保證安全和隱私的情況下,賦能相應的公共數據。

三個場景之間也有多向循環(huán)關系:互相之間相輔相成、互相支撐,任何一方都向另外兩方賦能,另外兩方反過來反哺或者重塑、促進這方建設。這樣形成一個面向場景的公共數據開放利用的體系。在這個過程中,地方政府一是要有利用公共數據向經濟社會賦能的能力;二是要有包容和眾創(chuàng)能力,讓整個社會參與利用公共數據過程當中,享受數字經濟帶來的紅利;三是加強公共數據統籌治理能力,參與打造各類應用場景,構建整個數字生態(tài),最終目標是推動數字化發(fā)展。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2022-05-27
復旦大學鄭磊:公共數據開放存在四大問題,建議面向場景開放
復旦大學鄭磊:公共數據開放存在四大問題,建議面向場景開放,C114訊 5月27日消息(南山)在昨日舉辦的2022中國國際大數據產業(yè)博覽會之場景大數據論壇上,復

長按掃碼 閱讀全文