八、秋分  自然語言與中文結構

綜合前述各項說明,我歸納出了中文文字概念之基本因素。根據這些基本因素,才能將每一個中文字彙明確地界定清楚,並貯存在電腦中。當某一文字輸入時,經過程式之基本因素分析,電腦之「意識中樞」便得到所代表的概念。意識中樞亦能反向將基本因素組成概念,並將之轉化為語言、文字,以與人溝通。

這些基本因素即為各種主觀客觀現象之根本,透過電腦中的「意識中樞」之「瞭解」程式,凡與概念結構有交集的,則分別與所設定之概念連通,意識即產生了對此概念的「認知」。有了瞭解及認知,再加上電腦做為主觀個體之「立場」,以預設的「目標」作為「判斷」條件,電腦便有了「智慧」。在必要時,尚可以賦與「行動」的能力。

以下我簡單地說明其具體之步驟以及設計之原則。

在概念資料中,「基本因素」具備三種特徵:

一、代表客觀、主觀等現象最基本且完整的觀念:

對概念而言,「基本的」並不等於「單純的」,由於形成概念之聯想特性,主觀客觀交互糾結,沒有任何概念能獨立存在。因此,我將前表的二百五十六種分類假定為最基本且完整的觀念,並視之為分類因素。在實際應用時,尚須利用分類因素作交集定義,才能明確地將每種概念加以界定。

二、文法或文字應用之原則:

文法是硬性規定的,沒有靈活的變通性,雖歷經許多語文學家的努力,始終無法整理出一套具有公信力的中文文法來。也幸虧如此,我們得以摸索出一條中文文字應用的原則。基本上我們承認主詞、述語之陳述結構方式,但在文字與文字結合時,則採用彈性的始態、終態、連續態,以「達意」為原則。

三、有與感應功能機構(即感官)結合之條件:

要讓電腦達到認知的目的,必須瞭解電腦之特性,利用資料匯流排以及軟體程式多次選擇的功能,每當「概念」資料傳送到匯流排上時,可以選定適當之輸出入埠,使「感應功能機構」得到正確的電流脈衝。

前兩項在前文已解釋過,現略分析分類基因與感應功能結合之方式,即得到下列關係。實際上此類結合常涉及知識,而知識係貯存在「知識庫」中,除了預設之知識外,尚可以經由學習過程,填入資料結構中。

概念是獨立的單元,僅能代表靜態的事物。而人類處身在四度空時中,面對的事物瞬息萬變。因此,人類在認知或表達概念時,必須使之成為動態的形式,這種動態的形式,早在原始時代即被普遍應用為語言。

如果以電影為例,一格一格的畫面可以視作獨立的概念,放映即是將靜止的畫面連續成為動態的畫面,人藉此瞭解電影所表達之原意。因此電影也是一種語言,而且靈活又有趣。想要瞭解語言真相的人,最好先由電影分析著手。

語言雖然發展得早,但在發展初期人類的智力尚未成熟,對於規律的掌握還在摸索階段。故越早期的語言,其規律性越低。學習第二種語言的人,常對該語言「不規則」的文法、字詞變化等傷透腦筋,偏偏那些最討厭的部分往往是最常用的習慣語法!由所有不規則的習慣語法,可以看出來人類最初的習慣性行為是什麼。奇怪的是中文中並沒有「不規則」的觀念。

中華文化真正的價值,就在中文的概念結構。過去因為對資訊認識不足,無法發揮中文的絕對優勢。好在真理不辯亦明,中國人亦為人類家屬的一員,過去遺留的寶貴資產,尚有待未來人類共同努力,發揚光大。

我開始考慮概念分類時,就像做中文輸入研究一樣,完全是在黑暗中摸索。等到理出一些頭緒,有了初步的結果後,才發現美國學者早在二十幾年前就考慮過這種方法。但是他們只做了些最表面的分析後,發覺此路不通。自後因為電腦技術的進步,學者專家紛紛改由分析文法及字典著手,仍然沒有找到可行的方向。

近年來概念分析似乎又有抬頭的趨勢,可是據我研究的結果,英語在長期發展過程中,倚重發音以表達概念。在錄音機未發明之前,聲音無法記錄,全賴一代一代之間的口口相傳。加以人類能辨識的聲音有限,必須採用複音節才能有效運用。這一來,一個英語字彙本身就是一組複雜概念的結合,很難從中理出基本概念來。

其次,英語有規則嚴謹的文法結構,雖然有其優點,卻因此喪失了語言文字的演進痕跡。我們要想找出人類思維的真相,就必須瞭解思維所應用的元素,這些元素就是組成原始文字語言的基本概念。既然英語業已經過整理,現代人所用之英語必然與整理前的有所不同,那又如何去找尋那些失去的環節?

人類最初發展的概念一定是不完整、簡陋不堪的,我們想知道人是怎麼瞭解概念,其途徑之一是找到概念的發展原因及過程,此必須有保存良好的原始條件。對英語甚至所有的拚音系統來說,這個機會是非常渺茫的。中文基於視覺符號的發展應用,走向圖形文字,每個圖形在當初只代表一種具體概念。後來雖然擴大了應用的範圍,注入了一些新的認知,但原意還在,而且各種文獻一直保持至今。

中文最有利於追溯思維因素的一點,就是其單音概念。單音因為不易辨識,所以中文常將單音字組合成「詞」、「成語」來使用。這些單音字正好就是各種概念的礦床,只要能有系統、大規模地整理研究,人類思維的歷程必然昭然若揭。

我在沈紅蓮的協助下,收集了近二十萬個「詞組」,花了很久的功夫,把每個詞的含義以及組成詞的各單字間之關係,一一加以分析,又經過多次的修訂,才得到第七章的分類表,以及概念基因和常識結構等。

我不厭其煩地說明這點,主要的原因是希望國人瞭解中華文化的博大精深,絕對不是虛語。尤其我很希望當今從事中國文學以及語言文字學的學者們,千萬不要妄自菲薄。風水輪流轉,智慧之鑰已在你們的掌握之中,智慧科學就靠各位發揚光大。

我很瞭解自己,創新突破是我的長處,但卻缺乏嚴密周全的細心。智慧科學將是人類文明對宇宙進化的最終貢獻,唯有大家捐棄私心、成見,精誠合作,截長補短,才可能有真正的成果。至於上述的分類,只是在啟蒙時期,個人一點不成熟的心得而已。

以下且以使用最頻繁、最複雜的「打」字為例,說明我們怎樣利用中文的特性,將其前後字義的關鍵分析出來(其餘的文字也是以同樣的過程,一一整理歸納出來。)

我們所收集有關「打」字的複合詞,因數量太多,在此僅抄錄具代表性者如次:

「打」字在前,後接動詞、名詞、狀態詞等:

一、動詞在後,「打」或指一種行為,或表某種動作或行為之進行。

打鬥,打仗,打劫,打擊,打擾,打鬧,打獵,打掃,打撈,打造

打磨,打扮,打賭,打量,打鼾,打盹等。

二、名詞在後,泛指用手進行之活動(可能有引申義):

打球,打牌,打更,打鼓,打鑼,打針,打鐵,打靶,打拳,打勾

打油,打水,打酒,打柴,打魚,打包,打結,打傘,打字等。

三、指動作行為,後接終態詞、結果詞或程度詞:

打定,打成,打下,打住,打完,打好,打壞,打消,打傷,打死

打破,打穿,打斷,打碎,打爛,打倒,打通,打動,打得等。

四、典故,或因習慣用法而有他義者:

打發,打尖,打點,打烊,打折,打算,打雷,打諢,打手,打啞謎等。

由上可知,「打」在前時,多以其後之字定義,本身僅作發生、進行及完成助詞。

「打」字用在後面者較少,除用作單位外,多為「打」之動作。

一、前為數字者,「打」作為單位用:

一打,半打,兩打,幾打等。

二、前為動詞,表示打之方式,前為名詞,則指用工具之動作:

扭打,撕打,拍打,拷打,捶打,摔打,抽打,敲打,毆打等。

鞭打,棒打,錘打,拳打,手打等。

三、前為助動詞、形容詞、副詞,則描述「打」的情況:

能打,肯打,會打,愛打,亂打,狠打,痛打,經打,耐打等。

四、專用術語:

單打,雙打,代打,全壘打等。

我們一再分析各種單字之組合,發現了中文詞組有一定之組合方式,除了一部分習用已久或出自典故難以合理的歸類外,絕大多數都有前後順序之關係。一般說來,同性質之字,前面的字義多為「始態」,後面的則為「終態」(亦即前者為因,後者為果)。形容詞、副詞多用在前,一旦用在字後,則一定是一種結果的狀態。這種發現奠定了我們對中文具有「映畫」功能的信念,因此,我們僅以單獨的文字概念作為「動畫」的元素,再以前後之關係定義之。

這種方法不但可以節省文字定義的空間,

上一章目錄+書簽下一頁