第三部分 大數據時代的管理變革 結語 正在發生的未來

大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。

如果真變成這樣,為人類開闢出一塊領地,為直覺、常識和意外運氣騰出空間就十分必要,以確保它們不被數據和機器回答擠兌出去。人類最偉大之處正是運演算法和矽片沒有揭示也無法揭示的東西,因為數據也無法捕捉到這些。並不是「人類最偉大的東西是什麼」,而是「什麼不是人類最偉大的產物」——真空、人行道上的裂縫、未說出口的話還是未想到的事?

科技再先進也無法將世界上數據的總量(即最終的樣本=總體)盡數收集、儲存和加工。例如,歐洲粒子物理研究所()位於日內瓦的粒子物理實驗室在試驗中只能收集到不到0.1%的反饋信息,其餘信息將同潛在的知識一起消失在乙醚中。這種情況司空見慣。從羅盤和六分儀,到望遠鏡和雷達,再到今天的全球定位系統,人們總是受到現有測量和認知工具的局限。我們明天使用的工具很可能比今天的強大數倍甚至上千倍,我們現在所擁有的知識較之明天可能就顯得微不足道了。要不了多久,當我們回看當今的大數據世界時,就像在看阿波羅11號上僅4Kb內存的導航控制計算機一樣,會覺得十分奇特。

最終,大數據標誌著「信息社會」終於名副其實。我們收集的所有數字信息現在都可以用新的方式加以利用。我們可以嘗試新的事物並開啟新的價值形式。但是,這需要一種新的思維方式,並將挑戰我們的社會機構,甚至挑戰我們的認同感。可以肯定的是,數據量將繼續增長,處理這一切的能力也是如此。但是,現在大多數人都認為大數據是一個技術問題,應側重於硬體或軟體,而我們認為應當更多地考慮當數據說話時會發生什麼。

無論大數據如何威脅到隱私保護,最讓人們頭疼的都是行為傾向問題。大數據預測的準確性越來越高,它能夠預測行為的發生,在人們犯錯之前,提前懲處。因為預測的結果幾乎不可反駁,人們也就無法為自己開脫。但這種基於預測得出的懲罰不僅違背自由意志的原則,同時也否定了人們會突然改變選擇的可能性(無論可能性有多小)。當我們給一個人判定責任(並給予懲罰)時,必須牢記人類意志的神聖不可侵犯性。人類的未來必須保留部分空間,允許我們按照自己的願望進行塑造。否則,大數據將會扭曲人類最本質的東西,即理性思維和自由選擇。

他們將城市裡的90萬棟建築都列在表上,然後輸入來自19個不同機構的數據集。這些數據顯示了建築業主是否拖欠了應繳房產稅,是否有止贖訴訟,是否有公用設施使用異常或導致服務消減的未付款項。他們還輸入了建築類型、修建時間、救護車訪問次數、犯罪率和嚙齒動物投訴等信息。然後,他們將這些數據與五年來的火災嚴重性排名數據進行對比並得到一個模型,以此預測哪些投訴迫切需要調查。

儘管如此,他們並不滿足於僅僅對數據進行運算,而是會到現場觀看檢查員的工作。他們不斷做著大量筆記,並詢問一切流程的開展效果。當一個頭髮斑白的領頭人哼了一聲說「找到那個建築不是問題」時,他們很想知道為什麼這個人會這麼自信。但領頭人自己也說不清楚為什麼,不過弗勞爾的小夥子們漸漸發現,這種直覺來自建築物外新的磚工,它暗示著建築物的主人很重視這個地方。

我們能收集和處理的數據只是世界上極其微小的一部分。這些信息不過是現實的投影——柏拉圖洞穴上的陰影罷了。因為我們無法獲得完美的信息,所以做出的預測本身就不可靠。但這也不代表預測就一定是錯的,只是永遠不能做到完善。這也並未否定大數據的判斷,而只是讓大數據發揮出了應有的作用。大數據提供的不是最終答案,只是參考答案,為我們提供暫時的幫助,以便等待更好的方法和答案出現。這也提醒我們在使用這個工具的時候,應當懷有謙恭之心,銘記人性之本。

大數據也被用於發展經濟和理解如何預防衝突。基於手機動向數據顯示,非洲許多貧民窟地區經濟活動十分活躍。大數據還揭示了最可能引發種族關係緊張的社區以及解除難民危機的方式。只有當科技應用至生活的方方面面時,大數據的使用範圍才能進一步擴大。

就算大數據無法教會我們所有事情,只要能幫助我們表現更佳、更富效率、取得進步,就算缺乏深入理解也是很有用的了。一貫如是地堅持下去才有效力。即使你不明白為什麼付出的努力得不到回報,但相比不努力,你要明白你已經在改善事情的結局了。紐約的弗勞爾和他的「小夥子們」也許並沒有聖人聖明的判斷力,但他們確實在拯救生命。大數據不會即刻提高效率,但經受住時間的考驗後,它將生出智慧的結晶。

這為「社會進步」的概念提供了重要啟示。大數據讓我們試驗的速度更快,發現的線索更多。這理應能夠產生更多的創新成果,但發明的火花卻往往存在於數據未顯示出的信息之中,因為它並非真實存在,是多大量的數據都永遠無法確定或證實的。如果亨利·福特問大數據他的顧客想要的是什麼,大數據將會回答,「一匹更快的馬。」 在大數據的世界中,包括創意、直覺、冒險精神和知識野心在內的人類特性的培養顯得尤為重要,因為進步正是源自我們的獨創性。

大數據是一種資源,也是一種工具。它告知信息但不解釋信息。它指導人們去理解,但有時也會引起誤解,這取決於是否被正確使用。大數據的力量是那麼耀眼,我們必須避免被它的光芒誘惑,並善於發現它固有的瑕疵。

紐約市分析煉金師的經驗凸顯了本書中的不少主題。他們使用了龐大的數據量,而不僅是一些數據。他們所列的城市建築基本上可以視為「樣本=總體」。位置信息或救護車記錄等數據比較凌亂,但是這並沒讓他們就此放棄。更多數據所帶來的好處遠比原始信息少所帶來的弊端更重要。他們之所以能取得成功,是因為城市的很多功能都以數據的形式呈現(儘管存在不一致),從而使他們能夠處理和使用這些信息來提高預測效果。

專家暗示,無論是自大的統計學家還是專管投訴熱線的公務員,在數據驅動方法面前都應退居次席。與此同時,弗勞爾和他的小夥子們不斷地讓經驗豐富的檢查員來測試他們的模型,借鑒檢察員們的經驗,使系統表現得更好。這個項目成功最重要的原因是,它更多依賴的是相關關係而非因果關係。

在一個預測的時代里,人類的自由意志神聖而不可侵犯,這一點不可輕視。我們不僅需要承認個人進行道德選擇的能力,還要強調個人應為自我行為承擔責任。社會則必須採取新的保護措施:接受一種新的職業人,也就是數據演算法師,對大數據進行深度分析。如此,因為大數據而變得可預測的世界,才不會陷入一個用一種未知取代另一種未知的困境中,不會變成一個黑匣子。

大數據在實用層面的影響很廣泛,解決了大量的日常問題。大數據更是利害攸關的,它將重塑我們的生活、工作和思維方式。在某些方面,我們面臨著一個僵局,比其他劃時代創新引起的社會信息範圍和規模急劇擴大所帶來的影響更大。我們腳下的地面正在移動。過去確定無疑的事情正在受到質疑。大數據需要人們重新討論決策、命運和正義的性質。我們的世界觀正受到相關性優勢的挑戰。擁有知識曾意味著掌握過去,現在則更意味著能夠預測未來。

當我們準備開發電子商務、寓生活於互聯網、進入計算機時代或者拿起算盤時,這些事情比那些代表他們的問題更加重要。我們尋找原因的想法可能被高估了,很多情況下,弄清楚「是什麼」比找尋「為什麼」更加重要,因為前者表明事實才是我們生活和思維的基礎。這些問題可能沒有答案。或許,它們是關於人在宇宙中的位置以及能否在喧囂混亂、不可理喻的世界中尋找到意義這一永恆爭論的一部分。

2011年6月,弗勞爾和他的小夥子們開始啟用他們的系統和方法。他們每周瀏覽一次可歸為「非法改建」一類的投訴,將他們認為前5%有火災危險的投訴轉交給檢查員立刻跟進。當拿回結果時,所有人都驚呆了。

「我對因果關係不感興趣,除非它用行動說話。」弗勞爾解釋道。「因果關係是別人的事,坦白說,談論因果關係是非常冒險的。我不認為有人提出房產止贖程序和那個地方是否長期存在結構性的火災風險之間有任何關係。我認為這麼想很愚蠢。他們會認為有一些潛在的因素,但沒有人會站出來承認。我不想深究這個,我需要一個能夠把握的特定數據點來告訴我它的意義。如果它很重要,我們就會採取行動。如果不重要,我們就不會行動。你知道,我們有真正需要解決的問題。我不會閑逛,或者像現在一樣想著因果關係的事兒。」

弗勞爾為了找到合適的人而廣泛撒網。「我對經驗豐富的統計學家沒有興趣,我擔心他們不願

上一章目錄+書簽下一頁