第三章 Web 3.0 物聯網的四個階段

時髦的新詞「圖表」是否會取代仍在使用但卻顯得有些過時的「互聯網」或「網路」?我並不試圖為此下結論。我敢打賭,「博客」一詞一定是一個謙遜的人發明的。但我的結論並不重要。蒂姆·伯納斯-李 (Tim Berners-Lee)在他發布的《巨型全球圖表》(Giant Global Graph)中,用了很時髦的「圖表」一詞,給出了我見到過的、對「語義網」最好的總結——我想部分原因在於他並不談論語義。

他的論點很值得轉述。以下內容重述了他的觀點,並加入了我對語義網和Web3.0的總結。

第一階段:

當前信息傳播演進的第一階段是與電腦聯機。我們稱這種聯接為網路群之間的網路,或者互聯網。聯機階段的互聯網有用但很枯燥——有點像沒有電話的電話系統。如果你要訂機票的話,最好的辦法是聯接航空公司的電腦。聯機系統的積极參与者得採取開放的姿態——互聯網上的電腦必須樂於中轉其他人的數據包。在聯機系統中,單機並不能完全控制它的數據包(這與電話系統是不同的)。

第二階段:

信息數字傳播的第二階段是聯接文件和網頁,而這就是網路。在第二階段,可以進入關於你航班的頁面或文件,而非航空公司主頁。信息解析度的細化使系統更為有用。但是,想要在這個信息的競技場有所表現,參與人員需要公開並分享他們的網頁,那些登陸後才能顯示頁面的設置往往會弄巧成拙,而且你也不能限制那些聯接著你的文件的網路鏈接。新手們往往會在上述幾個方面誤操作。當你網頁的內容被複制粘貼時——有時是部分,有時是搜索引擎索引的全部——你得心胸開闊地接受它。這是個信息共享化的階段,但聯接的價值基本上都獲得了普遍認同。

第三階段:

我們現在處於第三階段開端的收尾之處。在這一階段,我們繼開始聯機共享電腦和文檔之後,開始了共享文檔中的數據。我們聯機共享各自文檔中的內容及其相關信息,並主動製作鏈接。因此,我們現在可以直接聯入航班信息,而非之前的航空公司電腦或者航班頁面。數據已被拆分成便於在任何網路設備上閱讀的形式,事實上,當這一階段正確完成時,信息就可以被網路本身所包含,因為這時,它不再以英文等語言文字呈現,而是以一種一般語義形式存在。這種普遍形式是存在於資料庫中的。其實,你可以將此階段理解為全球資料庫。

擁有我們這個世界的數據訪問權,是與那些被以三個首字母作為簡稱的互聯網技術的發明與自由應用分不開的,比如XML、RSS、API、RDF和OWL。這些都是在網路上交流和共享數據的標準。僅僅依靠使用RSS服務來聚合網站中的內容,能夠完成的工作都是驚人的。另一項極受讚賞的使能技術是API,該網關允許龐大數據的可控共享,通過一般的網路效應,它能儘可能地釋放數據的力量,即使用數據的人越多,其價值就越大。正如前兩階段,人們掙扎著克服對共享的恐懼,而相較於電腦或文件共享,數據共享使人們更加親密,因此也更容易讓人感到恐懼。但是,學習如何共享數據將是下階段網路的發展方向。這一階段,數據共享全部的真正價值建立在從深層鏈接、深層聯繫和自由(必須是合理化的)釋放個人寶貴數據中湧現出的價值上,而那些能夠放手共享信息、並理解以上價值的將是從中獲利最大的技術和組織。

以下是蒂姆·伯納斯-李的表述:

共享邀請方的控制力在減弱。事實上,在每一個層級——網路、萬維網或圖表——為了獲取更大的利益,我們已經讓渡了一些控制。讓你的數據與別人的數據相連,在某種程度上有點像放手。這仍然不是送給別人一些他們沒有許可權的數據,而是讓它們與來自同層級網站的數據相連接,也就是讓我們的數據與來自其他應用程序的數據相連。

第四階段:

順便說一句,我不認為第三階段是歷史的終結,或是故事的結尾(我已經學會了質疑那些三段論的歷史)。我認為我們可以邁向第四階段,即趨向於連接起事物本身的階段。你想把關於某物的所有數據都嵌入其中,你想要把位置的信息嵌入到位置本身中去。其實,你想要聯接的並非航空公司的電腦,也不是航班頁面,更不是航班數據,而是航班自身。理想的情況下,我們可以連接到嵌入式數據處理程序及飛機的原始信息,連接到機艙里的特定位置——所有這些我們稱之為「航班」的複雜項目和服務。我們最終想要的,就是物聯網。

在物聯網中,我們製造的所有東西都包含一條連接鏈——雖然還有段路要走,但我相信我們能夠創造它。數據的互聯網——全球資料庫——正在加速建設中。據我所知,這正是人們理想中語義網的樣子。這是因為,為了共享,信息被從自然語言中提取出來,並被簡化為截然不同的信息元素,而後進行標籤,放至資料庫。在這一基礎形式中,它可以被以數以千計的新方式重組為有意義(具語義)的信息分子。但當它還停留在淺層的未註明的原始文件狀態時,這些新方式則毫無用處。

我想數據的這種共享式提取也是人們所理解的Web3.0。在這個版本的網路層中,數據激增、流動並在網站間擴張,就像它出於大型資料庫或大型機器中一樣。我的網站索取了來自愛麗絲和鮑勃的穩定數據流,通過以新的(語義學的)方式重組的過程,這些數據增加了價值,而後,我將我自己組織好的數據流發布出去,使它們成為別人消費的原始數據。這種數據生態系統在一種開放的交互系統下運行,即使並非所有數據都被共享或公開,但這也是一種經雙方同意的的協議。

一個運行良好的語義網、全球資料庫、巨型全球圖表、Web3.0,將讓數百萬看起來更聰明的服務成為可能。我不會重複告訴每個網站誰是我的朋友,一次就夠了。如果我的名字出現在文本中,它就會知道那是我。我所在的城鎮也將成為網路上的城鎮——一個擁有可定義字元的地方——且別的字元不能替代。這種遍在性使任何我所在城鎮的消息都鏈接到關於這個城鎮的真實信息。網站看起來更聰明了,這表現在它「知道」更多東西——並不是以一種有意識的方式,而是表現在程序化方式上。呈現在網路上的概念和物品將能夠互相指認並了解對方——以一種它們現在還不可用的基本途徑。

細節很重要。哪項協議成功?哪個標準有效?哪個公司保持多數優勢?——這些都是未知數。政策細節也很重要。文檔和電腦作為所有物,不像數據那麼不可預斷,因為數據是出名的難以標定所有權的。再有就是難以界定的身份問題。如果網路知道你總是你,那麼「你」是誰?如果絕對的個人服務的代價是絕對的個人透明度,那麼它們與絕對的個人監視又有什麼區別?

語義網的靈活性將使很多人焦躁不安。儘管它將與人類保持很大的距離,但它對事及對人的無所不知仍然會使很多人畏縮不前,並推遲其發展。我只能指望孩子們會喜歡上它了。

2007年11月29日

上一章目錄+書簽下一章