第二部 Farside 13.Japanese

總計超過120億字。

這還是粗略估算。

這些日本文字應當分為若干範疇,關於這一點,眾人的意見是一致的。漢字、漢漢字、漢漢漢字、平假名、平平假名、片假名、平片假名、片平假名,這些類別的存在大致都被認可。但是關於平平平假名的存在,還處於爭論中,平漢字、片漢字分類的必要性也不時被提出。

解讀作業基本上沒有任何進展。

發現的文本,大部分都是十萬到百萬字的大塊文章。而給解讀帶來障礙的是,那些大塊文字中,基本上沒有重複的文字。這些文章被稱為日本文書,其中出現的重複文字非常少,就連重複度最高的「ぴ」字,也只出現了7000次。而且有人堅持認為,並不是「ぴ」出現了7000次,而是「ひ。」和「ぴ」等異體字構成的文字族。

在解讀未知文字時,常用的有效手段是識別數詞符號,然而就連這個也還沒有確定。「一」「二」「三」大約是數字,這一點可以從它們的形態上識別出來,但「三」以後的數詞應該是什麼符號,則眾說紛紜。有人認為「口」「木」等符號應該被視為「四」,但舉不出強有力的旁證。

一般認為,運算符比數詞的解讀準確度更高,然而這依然沒有超出推測階段。「十」可能是加號,「二」可能是等號。「廿」「土」「王」有的說是數詞,有的說是運算符,總之意見都不一致。

文書中頻繁出現計算內容,這一點誰都能看出來,但對解讀並沒有什麼幫助。不知為什麼,在這種計算式的寫法中,似乎並不存在進位。因為如果存在進位,那麼不管採取哪種進位,總會重複出現同樣的符號。所以大致可以推測採用的是無限進位。但即便如此,重複的符號也太少了,所以有人認為在這種寫法中,符號每次出現的時候可能都會變換形態。也就是說,第一次出現的1,和第二次出現的1,會用不同符號加以表示。這個假說似乎解釋了什麼,然而又似乎什麼都沒解釋。

文章是自上而下縱向從右往左,或是從左往右橫向自上而下書寫的。這一點可以從筆法和書記的痕迹中辨別出來。然而即便是在這一點上,日本文書也有特殊之處,表現在相鄰的行或列之間存在著可以稱之為相互作用的標記。在縱向書寫中,時常會有某些文字的橫線水平貫穿若干列。那線並不是在重合的文字上新畫的,而是極其自然地構成其他文字的一部分。橫向書寫的時候當然也會出現縱向貫穿若干行的線條。大體而言,縱向與橫向的縱橫寫法看起來沒有顯著差異。至少,似乎不管縱向書寫還是橫向書寫,都不會影響含義。雖然也有見解認為縱向與橫向的意義不同,但並沒有什麼實際的根據,當然認為意義相同也舉不出什麼特別的根據。

有些人認為這樣的技藝只能預先巧妙組合出文章,然後再做謄寫。但實際上,大部分文章都呈現出草稿的模樣。話雖如此,也看不出預先留出空白以便填入貫穿橫線的徵兆,只是像極為平常的草稿一樣的寫法,而寫出的文章就是這個被稱為日本文書的文字群。

從這一高度的設計性推測,有假說認為,日本文書也許僅在外觀上展現出文字的模樣,實際上只是沒有任何意義的線條排列而已。但如此看來,這篇文章卻又展現出令人感覺到蘊藏著意義的外觀。大量產生沒有意義的塗鴉行為本身,很難說沒有任何意義。就像前世紀末葉攪亂世界的偽狄奧尼修斯文書之類的文件中也能看到的那樣,僅僅是大量古文書的發現本身,就有著稱為一個事件的性質。偽狄奧尼修斯文書,通過發現生成那一文書的演算法,而被廣泛承認為偽書,但偽造者的失敗之處也可以說在於各個文字能夠確定為各個文字。如今,對於有限組的符號串,基於機械運算的推測,具有壓倒性的力量。日本文字的困難性,原本也是在於很難判斷這裡所使用的符號數量是有限還是無限的。

對這種設計性,還有一個很難說有魅力的假說。

日本文書,是由這數萬字的文字集合而成的、一個巨大的文字。

如果採納這個假說,將整體視為巨大的文字,那就會產生這樣的疑問:構成要素為什麼這麼像一個個的文字?如果要書寫巨大的複雜文字,只要創造出巨大的文字就好,有什麼必要特意採用這樣的文字體系,將小的文字納入到網路狀結構中呢?而且在這種情況下,頁面排版也會成為問題的吧。

既然前提是假設,那麼擁護也好,反對也好,爭論也只能成為假設的產物。既然是人寫的東西,那麼在設計某種程度的巨大物體時自然需要先分割再整合的看法,大腦構造強迫要求這種構成的看法,從表音文字到語義單位的二重分節化的再高一層的三重乃至多重分節化等等,有著各種各樣的意見。

有人提出一個很現實的問題:超過120億個文字的語言,誰能學得會?

但正如一切意見都有反對意見存在一樣,對於這一問題,也有相應的回答。答曰,這些符號串是基於少數規則不斷變形的符號隊列,只要學會了那些規則,就沒有必要去記這120億個文字。120億這個數,在組合上並不能算巨大。

如果能解析出那些規則,說服力自然會增加,然而贊成這一說法的人們,也沒辦法展示出那些規則,所以這一假說依然停留在假說的範疇里。

關於如何稱呼日本文書中出現的文字,有各種各樣的提議。一開始出現的是有點古怪的「概念文字」,最近稱之為「神經文字」的情況越來越多。

文字或多或少都伴隨著概念化,比如「椅子」這個文字指的就不是個別的椅子,而是指代一般的椅子。如果是為了記述事物而經過了概念化的文字,120億未免太多了。所以,這種語言會不會尚未經過概念化呢?從這種意見出發,確定了「概念文字」這種名稱。

而神經生理學家們認為,這種文字與其說經過神經網路的處理,不如說它更像是神經網路本身。這一假說和其他無數假說一樣,對解讀毫無幫助,但畢竟給了人一種彷彿解釋了什麼的感覺,因而多少獲得了一些人氣,佔據了一定的優勢。

順便說一下,對於這個意見也有異議。

正如「20扇門」的遊戲所展示的那樣 ,作為人類對事物加以分類的結果,不管什麼東西,大抵都可以通過20次的yes/no的提問加以確定。而要逐一指定選擇過程,需要220個符號。相比之下,120億這個數不得不說十分保守。如果對於已有的分類組合,文字數量都不夠,那麼在以之為基礎的組合性記述中,文字數量豈不是更會出現壓倒性的不足嗎?

神經語言提倡派對這個問題無力反駁,但馬上又轉入了反擊:現在所知的120億個日本文字,只不過是目前發現了這麼多資料而已。事實上,那些文字的重複度異常之低,如果資料的數量翻倍,文字數也會翻倍,三倍資料就會是三倍文字。

只要沒掌握文字的全貌,這種反駁確實很容易。不過已經120億的文字都只是部分,那它的全貌會是什麼樣子,委實讓研究者無從推測。

假說的數量已經非常龐大了,而在每次發生反駁之際,問題都會以極快的速度增大,這一現象是日本文字解讀中頻繁發生的事態。可以說,在其中某個階段,研究者們停止思考,或者遭遇了檢驗的實質上的不可能性,乃是阻礙解讀的最大原因。這可以說是由於資料的不足,也可以說是資料太多且過於混沌的緣故。有傳言說,調查隊在舊日本列島發現了新的資料,但又將之銷毀了。從當下的學術圈氛圍考慮,這一傳言也許包含了某種程度的真實感,讓人覺得說不定正是真相。

關於第12次舊日本列島調查團的全滅,有諸多假說。對於正式報告所稱的受到兇猛本土生物襲擊,很多人表示懷疑。報紙上刊登了結著大銀杏髮型 的力士隊襲擊調查團的諷刺畫,而眾所周知現在的舊日本列島上不存在超過大型犬體型的生物。所謂本土日本人的倖存被視為毫無可能,復興的希望更是無跡可尋。

舊日本列島調查團的足跡在舊東京市八王子區消失。現場發生了什麼情況,至今都只有推測。口糧、燃料等裝備都以通常行動的形態保留下來,沒有顯示出任何異常。也沒有發現爭鬥的痕迹。發現的日誌也只是按照規定平淡地記錄著調查的進展,沒有任何能夠窺見之後失蹤的線索。

從日誌中可以確定調查團在八王子區得到了大量的日本文字構成的文書。日誌中記載了在13/20位置獲得了總計超過20噸的紙質資料,但那位置無法確定。最後的宿營地是在被廢棄高樓包圍的公園裡,但並沒有帶走20噸資料的痕迹。搜索周圍也沒發現資料、運輸20噸資料的重型設備,以及連使用過重型設備的痕迹都找不到。

日誌中若干引人注目之處,在於嘗試用類似日本文字的符號做記錄。日誌後面往前倒過來使用的那個字元串,從筆跡上看,被認為是調查隊隊長的手筆。

由於日本文字的障礙,記載的內容不明。但從連接各行的縱線毫無阻滯來看,可以推

上一章目錄+書簽下一頁