第三章 Web 3.0 拜託,搜索中立不可能

要做到公平,一直是件難事。在許多人能做出多種選擇的體系中,公平通常不可能實現。肯尼斯·阿羅(Keh Arrow)是諾貝爾經濟學獎得主,他提出了阿羅不可能定理(Arrow Paradox),即,排名投票系統本質上不可能做到公平。更準確地說,這條定理是指,如果一個投票系統試圖對三個或以上的候選人進行排名,就不可能同時優化投票公平性的不同方面。這有點像老話說的「快,便宜,好——兩個任意挑」,因為無法同時滿足全部三項。從數學角度來看,對三個以上候選人進行排序時,無論是確保每張投票都有相同的權重,或保證每個結果都有相等的出現機會,還是採用其他公正排名的標準,都必然會對公平的某些方面造成損害。

每一種搜索演算法也是在進行排序選擇,對於它所排序的一些信息來源來說,同樣自來就不公平。無論是哪個搜索引擎,Bing也好,Ask也罷,抑或谷歌乃至還未發明出來的搜索引擎,返回的排序結果不可能滿足公平的所有維度。在某些方面它有所偏倚,就像投票系統會偏向某些方向一樣。

儘管如此,我們仍然想要公平和中立。在當今生活中,搜索既是一個不可或缺的服務,也是一個非常大的業務領域。新聞、商務和個人身份都經由搜索引擎過濾,自由原則也要間接通過搜索引擎來體現。搜索引擎的權力可能被濫用。這在中國已經發生,而我們也能夠在理論上想像這種可能。如果一個搜索演算法本身就是有偏好的,那麼是否有辦法能讓它變得更中立呢?

有許許多多的人都對谷歌的搜索引擎霸主地位感到不安。他們看到了搜索引擎的偏見本質。其中有些是商人,他們的生計受到谷歌演算法的影響;還有一些是關注谷歌主導地位的活動家、權威人士或學者。詹姆斯·格里梅爾曼(James Grimmelmann)在一篇很長、很清晰(以及非常具有質疑精神)的科技論文中,對關於建立搜索引擎「中立性」這一問題的最好論點進行了整理。他將這些論點精鍊成了8個建議性搜索中立原則:

1.平等性(Equality):搜索引擎根本不應區分對待各個網站。

2.客觀性(Objectivity):搜索結果有正確與錯誤之分,搜索引擎應該只返回正確的結果。

3.傾向性(Bias):搜索引擎不應歪曲信息圖景。

4.流量原則(Traffic):依靠訪客瀏覽量生存的網站不應被搜索引擎排除。

5.相關性(Relevance):搜索結果應最大限度滿足用戶的需求。

6.自身利益(Seft-i):搜索引擎不應利用自身利益謀利。

7.透明原則(Transparency):搜索引擎應該公開其網頁排名的演算法。

8.控制原則(Manipulation):搜索引擎應只根據一般規則對網站進行排名,而不應依據個人標準將網站排名升級和降級。

在我看來,這些要求似乎非常合理。接著,格里梅爾曼拋出了他的反駁論點:

可以想見,這八條原則都不可能成為健全的搜索監管的基礎。

他更進一步闡述表示:

雖然搜索中立的各原則並不一致,但這並不表示搜索引擎有權無視反壟斷、知識產權和隱私保護或其他法律,暢行無阻。搜索引擎有能力做出卑劣的行徑:據《商業周刊》(BusinessWeek)報道,中國搜索引擎百度公然對網站進行勒索,如果企業不買百度的廣告,它便把企業網站的排名降級。搜索引擎能做出什麼可怕的事情,不乏恐怖先例。我的看法就是,目前所提出的搜索中立可行性很低,並很可能使情況變得更糟。從其對搜索中立的定義上看,它沒有實現自己的初衷。

接著,他逐一駁斥了上述每一條原則,我在這裡進行了總結:

1.平等性——「谷歌當然會對不同網站區別對待——正因此,我們才去使用它。系統性地偏好某些類型的內容,對於搜索引擎來說並非缺陷——而是其意義之所在。」

2.客觀性——不存在客觀性。「搜索引擎用戶形形色色。他們抱著非常個人的高語境目標。一種搜索結果不可能放之四海而皆準……誰能說雅虎就是對的,谷歌就是錯的?那同樣也可以認為谷歌的低排名是對的,雅虎的高排名有問題。」

3.傾向性——整個網路就是有所偏倚的。「搜索引擎優化,互鏈作坊 (Link Farm),垃圾博客評論,黑客攻擊——你能想得出,就有人做得出,且都假以提高搜索排名之名。一個完全無形的搜索引擎,不引入新的價值觀或自己的偏見,那麼它也只會複製網路本身所潛藏的傾向性:極度商業化,垃圾信息多得嚇人。

4.流量原則——網站無權過問流量或排名 。如果搜索引擎認為某個網站對用戶來說不可取,那麼它就可以改變這個網站的排名。「搜索引擎的主觀性意味著,不同搜索引擎的結果經常會彼此相左,這也意味著,同一個搜索引擎的結果也會隨時間變化而不同。」

5.相關性——搜索引擎通過主觀選擇提高返回結果對於用戶的相關性,它們並非根據網站的偏好,而是在搜索引擎認為用戶想要什麼的基礎上,降低或提高網站排名。「搜索引擎爭相向用戶提供相關的搜索結果;搜索引擎之所以存在,只是因為它們能夠提供有偏好的搜索結果。」離開用戶範疇,相關性便難以定義,更難以檢驗,而且毫無用處。

6.自身利益——為自身利益影響搜索結果,這倒很有可能存在;有時確實會發生。壟斷性的假公濟私行為也非常可能發生。「搜索引擎批評家認為,搜索引擎應該披露與排名決定有關的商業關係。這是一個標準而明智的政策回應。」但是格里梅爾曼表示,「這並非中立性原則,也不是僅存在於搜索業務領域;這只是完善的法律規範的自然施行。」

7.透明原則——出發點是好的,但執行起來問題多多。如果演算法完全透明,就會被垃圾信息製作者利用,甚至出現更糟的可能,搜索引擎也就形同虛設了。如果針對他們透明開放,而他們不大可能快速調整以保護創新。「一切都取決於監管機構對搜索演算法中小細節的意義的評估能力。而從監管機構和法院其他數字技術領域的監管歷史記錄來看,搜索引擎自行評估的前景並不樂觀。」

8.控制原則——似乎是壞事,但「所有搜索引擎都被控制著,而且越巧妙越好。」人們所擔心的實際上是「人為操縱」或人工干預,或特殊待遇。「谷歌非常不願意透露自己是否或何時會針對個體修改排名。」垃圾郵件發送者應該受到「特殊待遇」嗎?「完全禁止本地操作會妨礙搜索引擎迅速關閉漏洞並懲治利用漏洞的人。」

總之,格里梅爾曼稱,搜索引擎也存在不可能定理。搜索引擎更重視用戶而非網站,這對於一些網站來說,可能顯得不公平。

搜索中立的爭論中有一點非常正確:搜索關乎用戶自主權。與任何其他通信技術相比,一個好的搜索引擎對用戶的利益更敏感……搜索中立的爭論中提出了一個正確的問題——結構性力量是否會削弱搜索引擎提升用戶自主權的能力?——搜索中立擁護者更關注對網站的保護,而非對用戶的保護。然而令人不安的是,網站通常並非用戶朋友。有時候他們是用戶的朋友,但更多時候它們只是需要訪問者,並願意不擇手段留住他們。

谷歌並不中立。它也永遠不會中立,Bing和其他任何搜索引擎也一樣。只要谷歌仍然把用戶置於排名網站的商業利益之上,只要谷歌在有利於用戶的基礎上合理追求自身的商業利益,那麼其非中立性就會讓搜索引擎和用戶皆大歡喜。

2011年4月12日

上一章目錄+書簽下一章