正文第十二章數學中的民主

對策論是對衝突進行數學分析，它存在於政治、商業、軍事或各項事務之中。對策論誕生於1927年，由數學全能行家約翰·馮紐爾曼創立。馮紐爾曼認識到經濟與政治中的某些決策條件在數學上與某些策略對策等價。所以從分析這些對策中所學到的東西可以直接應用於現實生活中的決策上。在1944年馮紐爾曼與普林斯頓大學經濟學家奧斯卡·摩爾根斯特朗合著的當代經典著作《對策論與經濟行為》出版之前，對策論，也叫衝突的科學，是鮮為人知的。

對策論的部分智力感染力在於它的許多成果，如量子力學或相對論，似乎是直覺的，甚至是顛倒性的。典型的一個問題是1948年《美國數學月刊》提出的，它還不時地在文獻中出現。有3位名叫阿爾、本和查理的男子，參加一個新式的以氣球為目標的擲鏢遊戲。參加遊戲者每位各持一氣球，只要氣球不破，就可以繼續參賽，優勝者屬於惟一保持氣球完好的參賽者。投擲的每一輪參賽者都以抽籤決定遊戲的擲鏢順序，然後依次投擲一支習鏢，他們對各自的投擲技巧全部心中有數：阿爾可以在5次中4次擊破氣球（命中率80％）；而本則在5次中可3次擊破氣球（60％命中率）；查理卻是每5次只有2次可以擊破氣球（40％命中率）。那麼每位參賽者究竟採用什麼策略呢？

答案很明顯。每位擲鏢者都得把目標對準較強對手的氣球，因為如果把它擊中，他所要面對的只是較弱的擲鏢手。不過，如果所有3位參賽者全都採用這種切合實際的試探策略，那麼他們會得到與擲鏢技巧相反的結果！概率計算顯示，查理這個最差的擲鏢手，取勝的機會最大（37％）。而阿爾這個最好的擲鏢手，獲勝的機會最低，為30％。本的獲勝機會也只有33％。

問題出在哪裡？問題就在於阿爾和本自己互相拚鬥時，查理幾乎不受任何威脅。由於阿爾和本彼此都堅持他們開始的策略，而使查理增強了他的倖存能力。

對於阿爾和本兩者來說，最佳的策略莫過於在把查理除掉之前彼此之間不進行爭鬥；而查理的最佳對抗策略仍然是把鏢擲向較硬的對手阿爾。在這種形勢下，阿爾和本獲勝之機會分別增加到44％和46.5％，而查理獲勝的機會則會戲劇性地下降到9.1％。然而這種局面可能是不穩定的。因為它需要阿爾和本進行合作。雖然阿爾是最佳的擲鏢手，但他還是沒有取勝的最佳機會，他可能想欺騙本。但是如果他不能用欺騙的飛鏢把本擊敗，則本可能回擊，而且計算出來的獲勝機會將會再次發生變化。

如果阿爾不與本合作，不論他是否可以欺騙本，他可能試用另一種策略，這個策略曾在耶魯大學數學研究所經濟學教授馬丁·蘇比克所著的《社會科學中的對策論：概念與解法》一書中討論過。

主要觀點是阿爾通過口頭威脅，試圖形成一種局面，使阿爾與本處於一種拚鬥狀態，但使查理不向他擲鏢，如同第一種情況那樣，而是把鏢擲向本。阿爾聲稱，只要查理不向他擲鏢，他也決不向查理的氣球擲鏢（而且總是把鏢擲向本）。阿爾要讓查理明白，如果查理向他擲鏢，他會還擊的。假如有報復的威脅，則概率計算就會證明，查理最佳做法僅是向本的氣球擲鏢。如果本也攻擊阿爾，則阿爾的總獲勝機會仍為44.4％，本則為20％，查理卻是35.6％，阿爾雖然未能增加其獲勝機會——百分率沒有變化——但現在他是競爭中的領先者。

當然，本也不善罷甘休。因此他也會像阿爾那樣，對查理髮出警告：「只要你不向我擲鏢，我也不向你擲鏢。要是你向我攻擊，我也以牙還牙。」面對來自兩個對手的威脅，查理的最佳策略是不對兩者中任何一位攻擊，而是擲向空中，假定規則允許持這種消極態度的話！蘇比克解釋說，這種奇特的策略對查理來說是最好的，因為只要沒有人攻擊他，那麼他在遊戲第一階段中的惟一目標就是在第二階段中增加他與本的一對一的對抗，而不是與阿爾對抗。查理聰明的手腕已使他獲勝的機會增加了0.6％，因而對阿爾來說獲勝的機會現在是38.1％，對本來說則為25.7％，對查埋來說則是36.2％。不過這還不是最後的定論。如果阿爾擴大了他的威脅面，從而使查理不再向空中擲鏢，那麼局面就會變得愈加奇妙。

這個問題是對策論中諸多問題中典型的一個。其基本前提是每位參賽者都是有理性的，而且都是力圖為自身利益考慮。這個問題的一項教益在於，顯而易見的策略——每位參賽者都試圖除掉較強的對手——並不一定是好策略。這就是我認為解法是反直覺的解釋。當然，由於你更進一步地投身於對策論，那麼你的直覺就會改變，而且如果它是完全意想不到的話，則意想不到的局面就會更加意想不到。氣球戰的另一項教益是，在缺乏有關參賽者能否聯絡、共謀、進行威脅或達成有約束力並可以實施的協議等信息的情況下，對可能的解法是不能進行正確評估的。在對策論中，往往需要了解這樣的社會學因素。

無須試圖進行嚴格的論證，我們就能很容易地理解，氣球戰可能類似於政治或經濟的競爭。按照紐約大學政治學教授斯蒂溫·布拉姆斯的看法：氣球戰的知識可以擴展到多位候選人的政治競選上，諸如1984年新罕布希爾州的民主黨總統預選，當時有8個候選人競選。布拉姆斯說道：「看來這些候選人的最佳戰略，莫過於在他的部分政治勢力範圍內追隨最強的對手。如果你是一個自由主義者，而且另外還有兩位自由主義者，那麼你就要追隨最強的一位。於是所發生的情況將是兩位最強的對手就會彼此攻擊，而且最弱者就會存留下來了。」這時，如果所發生的情況全面出現，那麼最弱的候選人就會在其政治勢力範圍內倖存下來。布拉姆斯說：「這是沒有辦法的，強有力的候選人會在這類競選場合中嶄露頭角。」

1951年，美國經濟學家肯尼思·阿羅令人信服地論證：任何可以想得出的民主選舉制度可能產生出不民主結果，這一論證使數學家和經濟學家感到震驚。阿羅這種令人不安的對策論論證立即在全世界學術界中引起了評論。

1952年，後來在經濟科學方面獲諾貝爾獎的保羅·賽繆爾森這樣寫道：「它證明了探索完全民主的歷史記錄下的偉大思想也是探索一種妄想、一種邏輯上的自相矛盾。現在全世界的學者們——數學的、政治的、哲學的和經濟學的——都在試圖進行挽救，都試圖挽救阿羅的毀滅性發現中能夠挽救出的東西，對數學政治來說，這一發現就是1931年庫爾特·哥德爾的數學邏輯的不可能證明一致性定理。」

阿羅的論證，稱之為不可能性定理（因為它證明了完全民主在事實上是不可能的），該論證已幫助他於1972年獲得了諾貝爾經濟科學獎。對策論中最早的和最驚人的成果之一，也就是阿羅的「毀滅性發現」所產生的影響使人們至今還能感覺到。

在民主投票中所固有的不民主悖論可以用一實例進行很好的解釋。現有3位朋友，羅納德、克拉拉和赫布，他們在辛苦工作一天之後，渴望吃一頓快餐。他們決定一起到3家餐館（麥克唐納、伯格王或溫迪）中的一家去就餐。但3人不能取得一致意見。羅納德渴望在麥克唐納餐館吃飯，那裡有漂亮的分餐盤，裡面裝著油膩的漢堡包和大量新鮮的炸土豆條，至於其他兩家餐館，他喜歡伯格王，然後才是溫迪。克拉拉想去吃牛排，因而他喜愛溫迪勝過麥克唐納，最後才是伯格王；赫布想吃大乳酪餅，因而最喜歡伯格王，最不喜歡麥克唐納。

這3位朋友決定用表決方法解決問題，首先在麥克唐納和溫迪之間選擇，然後在取勝者與伯格王之間進行表決。如果羅納德、克拉拉和赫布每人都按他們所實際喜愛的投票，那麼他們最後會選定伯格王（第二名則是溫迪）。

因為伯格王是克拉拉的最後選擇，她會很不高興。如果克拉拉在第一次投票不選擇她真正喜愛的溫迪，而改而投選她的第二選擇麥克唐納，那麼她就能確保麥克唐納在第一次和第二次中都能贏得表決。克拉拉由於開頭違背了她自己的意願而最終實現了所喜愛的結果，這就是悖論。

況且，即便羅納德和赫布識破克拉拉的策略，他們也不能有效地加以干擾。赫布很生氣，這是由於克拉拉巧妙的投票才使他的第三意願餐館成為獲勝者。反之，克拉拉這一方的「誠實」投票就會使赫布的第一意願成為獲勝者。赫布試圖說服羅納德，讓羅納德和他一起合謀進行某種不誠實的投票。但羅納德不願意參與，因為這樣做也不可能改變他自己的處境。克拉拉的投票已使羅納德的第一選擇的餐館成為獲勝者。

表決順序的改變也不能消除巧妙投票的可能性。它所能做的是給別人而不是克拉拉不誠實投票的機會。假定這3位朋友首先在伯格王和溫迪之間進行表決，再對獲勝者與麥克唐納進行表決，如果他們全都「誠實地」投票，那麼最終會選擇麥克唐納，使赫布大失所望。

如果赫布足夠機敏，能預見到這個結果，那麼他應在第一次投巧

正文 第十二章 數學中的民主

正文第十二章數學中的民主