周子衡:關于“大數(shù)據(jù)”的幾則誤判

什么是“大數(shù)據(jù)”?

什么是“大數(shù)據(jù)”?網(wǎng)絡經濟時代,人們在經濟社會中的諸種活動通過網(wǎng)絡賬戶體系來實現(xiàn),這些活動也就是所謂的網(wǎng)絡賬戶活動,其基本內容更多地體現(xiàn)為賬戶間的關系。這些賬戶活動及其賬戶關系是由數(shù)字網(wǎng)絡程序所設定的、驅動的,且被實時地記錄下來。這就形成了所謂的“大數(shù)據(jù)”。因此,大數(shù)據(jù)來源于大量的網(wǎng)絡賬戶的活動及其有效的記錄,簡言之,大數(shù)據(jù)是網(wǎng)絡賬戶數(shù)據(jù)。

有了大數(shù)據(jù),人們對于經濟社會的認識與把握進入到一個全新的時代,特別是,當區(qū)塊鏈等技術的應用,使得數(shù)據(jù)的真實性、準確性、可追溯性等得以確保,這就使經濟社會進入到一個較信息經濟更高位階的新階段,之所謂“數(shù)字經濟”。

那么,“信息經濟”中的“信息”又是什么?可以說,這些信息是數(shù)據(jù)形態(tài)的,也可以是非數(shù)據(jù)形態(tài)的,即便是非常專業(yè)化的信息,也都是供“人”來解讀并由“人”來分析與處理的;“數(shù)字經濟”中的“數(shù)字”,就是一系列的數(shù)量繁巨、復雜多變的“數(shù)據(jù)”,識別、分析與處理這些數(shù)據(jù)則往往遠遠超出了人力的界限,也超出了人機結合的界限,必須交托計算程序自行處理,這就是所謂的“算力”問題。從這個意義上說,數(shù)字經濟是對信息經濟的超越,是賬戶體系網(wǎng)絡化擴展、深化,所帶來的程序化驅動與自運行的必然結果。

“大數(shù)據(jù)”是經濟社會中人們經濟活動網(wǎng)絡化、賬戶化、數(shù)字化的反映而已,打個比方說,是經濟活動映射出的各類或多組“影子”而已。數(shù)字經濟時代,似乎“誰”“掌握”了大數(shù)據(jù),就能夠對經濟活動乃至經濟社會做到“全知”,進而能夠“預知”經濟社會的未來,甚或能夠“全能性”地主宰經濟社會,這些都是關于“大數(shù)據(jù)”最為醒目的誤區(qū)所在;此外,有關“大數(shù)據(jù)”的誤區(qū),還包括因肢解大數(shù)據(jù)所帶來的扭曲與謬誤。

大數(shù)據(jù)終將主宰經濟社會,消滅經濟選擇的自由?

有人認為,大數(shù)據(jù)意味著“全知”,進而“全知”意味著“全能”,發(fā)展開去,大數(shù)據(jù)終將主宰經濟社會,消除個體差異,成就一元化的經濟體系。是為關乎大數(shù)據(jù)最大之謬誤!

“大數(shù)據(jù)”是“經濟自由”所投射下的數(shù)字影像,它無法反噬掉“經濟自由”,成為經濟社會的主宰。經濟社會中的大數(shù)據(jù),是經濟活動的網(wǎng)絡化、賬戶化、數(shù)字化的產物,是經濟人自由意志的集合映射。換言之,沒有高度的經濟自由,沒有充分而多樣化的經濟選擇,不僅無所謂“大數(shù)據(jù)”可言,經濟數(shù)據(jù)更將急劇衰減乃至全面萎縮。

大數(shù)據(jù)就是社會經濟活動的一層“數(shù)據(jù)化的外衣”而已,不管它多么帖服、合體或隨型,活動著的是里面的“身體”,且這個“身體活動”是自由意志所決定的。如果認為,掌握了大數(shù)據(jù)就能影響乃至決定人們的經濟決策,將自身的意志貫徹到別人的頭上去,這就是本末倒置了,陷入到“人靠衣裝”、“佛靠金裝”的俗套了,甚或墮入“沐猴而冠”的把戲甚或“屎吃狗”的丑態(tài)中去了。

大數(shù)據(jù)是事物的表面,而非內里。體檢報告上的“數(shù)據(jù)”反映出體檢者的身體狀況,但身體狀況并不是反過來由這些體檢數(shù)據(jù)所決定,更不是由那些填寫、保留、使用報告甚或拿著報告讀的人所決定的。大數(shù)據(jù)有價值、有功用,但是其自身并不具備所謂的“意志”,誰要是能夠給大數(shù)據(jù)添加上個“意志”,就好比為它“請”了個鬼神牌位,這種為大數(shù)據(jù)“施法”的愚蠢念頭,關乎科學意義上的“祛魅”。

那么,是否有人能夠將自身的意志通過大數(shù)據(jù)來得以延展呢?這就像是在宣稱,即便不能神化大數(shù)據(jù),但是可以神化掌握或擁有大數(shù)據(jù)地人。如此,便不是在講鬼故事,而是直接粉墨登場、客串來裝神扮鬼了。

養(yǎng)雞場可以為每只雞建立一個線上賬戶,由此產生所謂的“雞場大數(shù)據(jù)”。借此,場主似即可將自身的意志加諸于每只雞身上。真的如此嗎?對此,動物學家或養(yǎng)殖專家一定會對此嗤之以鼻。十幾個世紀之前,武則天曾強令百花在隆冬里齊放,牡丹就是不從,這個典故眾所周知且耳熟能詳。動植物皆有其節(jié)律或意志,人類加諸于同類的意志尚不可為,何況施之于異類?

經濟社會的網(wǎng)絡化、賬戶化及數(shù)字化,究竟是拓展了經濟自由的意志,還是反過頭來最終可以扼殺掉經濟自由呢?一種立場認為,技術始終是中立的。當真如此嗎?印刷出版、書報廣播、電報電話、鐵路與航天衛(wèi)星、網(wǎng)絡與數(shù)據(jù)技術,等等,這些技術創(chuàng)新、應用與普及也曾飽受爭議,甚或泛社會化與政治化,但最終都顯現(xiàn)出其巨大的價值傾向或道義立場?!按髷?shù)據(jù)”本身是眾人自由意志活動的產物,是多樣化、差異化、自由化經濟選擇的反映。不管如何操弄議題,也不能使大數(shù)據(jù)反噬掉“經濟自由”。

究竟什么才叫做“掌握了大數(shù)據(jù)”呢?直言之,正是一些謊稱掌握了大數(shù)據(jù)的人想對另一些被定義為沒有掌握大數(shù)據(jù)的人,施加無與倫比的權力意志。這個說法,沒有任何細思極恐的效果,反倒是格外地尷尬與搞笑。大數(shù)據(jù)時代,不乏刻舟求劍者的出現(xiàn),其自認為是掌握了大數(shù)據(jù)的人,就此自詡為“全知者”,便放言可以隨意地支配與運用“大數(shù)據(jù)”,如此便似乎從“全知者”縱身一躍為“全能者”,幻想著可以用大數(shù)據(jù)消滅經濟選擇的自由。這就好比用經濟自由消滅經濟自由,用大數(shù)據(jù)反噬掉大數(shù)據(jù)。其如果不是“演”過了頭,那就一定是“扯”過了頭。

大數(shù)據(jù)能夠預知未來?

“全知”并非“全能”,“大數(shù)據(jù)”并不能“全能性”地預設未來,但是能否“先知”般地預知未來?同樣,做不到。因為,大數(shù)據(jù)在時間上是有約束條件的。

《舊約·傳道書》有云,“日光之下,并無新事?!钡f事究竟如何重現(xiàn)?只要充分地了解已發(fā)生的事物,未來便無所遁形嗎?人們所熟悉的先知們,并不是所謂的歷史學家,也談不上什么數(shù)學家。依憑歷史數(shù)據(jù),能夠預知未來嗎?如果可行,那么,先知們便無處不在、無時不在。我們或可文學性宣稱,歷史昭示著未來,但這在哲學上是危險的,將其上升為一種數(shù)理性的邏輯,更是艱困的,甚或根本無法企及的。即便歷史數(shù)據(jù)足夠全面、完整、有效,甚或及時,在邏輯上,也難以推斷出或確立起“歷史決定未來”的命題。

大數(shù)據(jù)是全量數(shù)據(jù),源于事實,也是事實,它并非既有經濟理論變量性的函數(shù)分析,并不能在時間軸上理所應當?shù)匮诱归_去。在時間軸上,大數(shù)據(jù)終歸是局部的,遠非全量,它是實然的,是已發(fā)生的,即其性質上仍然是歷史數(shù)據(jù)而已。問題再一次提出,通過歷史數(shù)據(jù)能夠“預知”未來呢?

大數(shù)據(jù)本身不是先知,也沒有誰能通過大數(shù)據(jù)成為先知?;诖髷?shù)據(jù)并不能建構所謂的“歷史規(guī)律”,更談不上把同大數(shù)據(jù)有所謂“關系”的某人或某類人嵌入到這一所謂的歷史規(guī)律中去,進而使其發(fā)揮主觀能動性,擔綱某種角色。歷史數(shù)據(jù)對于未來有一定的作用,但是根本上講,歷史數(shù)據(jù)并不能決定未來,換言之,未來并不是由歷史決定的。沒人能夠憑依大數(shù)據(jù)而可預知未來,成為先知。

歷史數(shù)據(jù)在多大程度上影響到未來呢?依憑大數(shù)據(jù),如何更有效地預測未來呢?這只是相對以往諸般遠非那么有效的預測而言的,終歸有所助益,然而,畢竟只是概率意義上的“預測”而已,絕非“預知”。人類經濟社會,就像是一盤永遠下不完的棋,沒人能夠準確地預判輸贏,遑論精確到輸贏多少。有了大數(shù)據(jù),便無所不知,無所不能,這無疑是一種妄想——大數(shù)據(jù)既不是主宰世界的上帝,也不是預知未來的先知。

上帝究竟是在擲骰子,還是在作計劃?沒人知道,包括那些真假先知們。

大數(shù)據(jù)包攬一切信息?

數(shù)據(jù)的標準化與格式化,決定了大數(shù)據(jù)不是“全息”的。

全知是指在一定標準或口徑下的全量數(shù)據(jù),但并不意味著包攬所有信息。信息的完整性是一個抽象而復雜的問題。數(shù)據(jù)信息往往是靜態(tài)的,是在一定時間點下的結論,其被有效地獲取甚或表達出來,就意味著一部分信息是確定的、靜態(tài)的,而另一部分則不確定、動態(tài)的。這就好像貓的眼睛一樣,當你用相機去拍攝它時,它便發(fā)生變化,也就是必然丟失掉或隱去一部分信息。所以,全知是就對象自身而言的,并非是與對象有關的全部信息而言的。

現(xiàn)實中,人們對于大數(shù)據(jù)的感受確是非常豐滿有力、醒目而刺激的,這種情況一時間使人們感性上誤以為這就是全息的。事實上,這種情形以往也反復出現(xiàn)過,有如第一次聽到電話聽筒里傳來另一端親友的話語,便以為那是真聲音;第一次看到大屏幕會被其上迎面開來的列車景象嚇到。確實,我們對于數(shù)據(jù)的感性認識,與對其的理性認知是兩回事。

數(shù)據(jù)與數(shù)據(jù)不同,這不僅體現(xiàn)在數(shù)據(jù)性質上,而且體現(xiàn)在數(shù)據(jù)層次與數(shù)據(jù)結構上。數(shù)據(jù)性質的不同,產生了數(shù)據(jù)結構問題,與數(shù)據(jù)關系問題,而數(shù)據(jù)關系又在影響著數(shù)據(jù)性質與結構。換言之,數(shù)據(jù)并非是均質的、平衡的。數(shù)據(jù)結構和數(shù)據(jù)關系,往往更是我們難以把握的。這就需要作謹慎有效的數(shù)據(jù)獲取、深刻全面的數(shù)據(jù)分析,以及有效的數(shù)據(jù)挖掘。我們很難用一組兔子的數(shù)據(jù)來驗證另一組鴨子的狀況,或者說,這樣做是風險極大的。數(shù)據(jù)的界限和聯(lián)系是非常復雜多變的。所有的數(shù)據(jù)之間存在著某種關系,但是,這些關聯(lián)需要不斷地被認識與發(fā)掘,而絕非是可以通過人為預設來加以限定或排除的。

事實上,大數(shù)據(jù)是在有限條件下的一種全量式的數(shù)據(jù)獲得,但是,它不是全息性質的,也根本做不到全息。如果認為,有了大數(shù)據(jù)的加持,經濟社會就成為全息的,甚或透明的世界,這實在是一種“幻覺”。慮不及此,類似“喜鵲叫喜,烏鴉叫喪”之類的“聯(lián)系判斷”都可以得到所謂的“大數(shù)據(jù)”的支持。大數(shù)據(jù)使人們更趨謙卑,而非使人燥妄,那種有了大數(shù)據(jù),便認為大數(shù)據(jù)無所不包,可以無所不知、無所不能,實為一大“虛妄”。上帝擲骰子嗎?假先知們跳出來爭辯那骰子究竟有多少個面,是為令人無語的怪誕行徑。

“大數(shù)據(jù)”當作“小數(shù)據(jù)”用?

經濟社會中,如果取得的數(shù)據(jù)樣本有限,就需要確立有效的分析框架,建立模型,確立函數(shù)關系,做回歸分析。然而,如果樣本不僅是充分的,而且是完整的,是全量的,那么數(shù)據(jù)分析就要擺脫既有的舊模式了。從全樣本的大數(shù)據(jù)中,收窄樣本數(shù)量,只選取部分樣本用來分析,是一種縮量的方法,縮量樣本分析后的結論又要適用于總量,這就是對大數(shù)據(jù)的“小用”。

舉例來說,如果能夠獲得一個城鎮(zhèn)全部機動車以及全部外埠入城車輛的運行狀況,我們就可依所設議題來直接抓取數(shù)據(jù),獲得結論。抽樣建模分析及其回歸分析,就不僅累贅,而且極有可能反鑄成大錯。簡單來說,大數(shù)據(jù),就是扳手指頭數(shù)不過來的狀況,交給機器與程序去“扳”,不僅數(shù)得過來,而且數(shù)出來了。大數(shù)據(jù)往往更多地可以直接抓取并使用,而非在數(shù)理化、模型化、函數(shù)化等“加工”后再使用。

大數(shù)據(jù)具有完整性和全局性的特質,如果采用部分局部數(shù)據(jù),然后試圖得出超出部分局部數(shù)據(jù)范圍的結論,這種既有的思維慣性,并不適用于大數(shù)據(jù)的邏輯和現(xiàn)實。大數(shù)據(jù)不能當作小數(shù)據(jù)用,小數(shù)據(jù)終歸拼不出完整的大數(shù)據(jù)。印度盲人摸象的故事講的就是避免以偏概全的道理,如果不是“摸”,而是帶著刀子去割,割下來再摸,再好的數(shù)據(jù)技術也拼不活那頭大象了。

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2017-09-07
周子衡:關于“大數(shù)據(jù)”的幾則誤判
大數(shù)據(jù)來源于大量的網(wǎng)絡賬戶的活動及其有效的記錄,簡言之,大數(shù)據(jù)是網(wǎng)絡賬戶數(shù)據(jù)。

長按掃碼 閱讀全文