七、概念  概念分類與中國文字

隱居生活逍遙自在,與神仙無異。外傳我移民加拿大,有此心,但無此金。葉隆雄現在是縣議員了,他的兒子有意結婚,我們不能因為他為人有義就賴著不走。

這時,沈紅蓮的父親癌症擴散了,家中需要有人照料,我們便搬到楊梅。

謝振孟教學很有成效,他不是只講倉頡輸入,常在上課時介紹《易經》以及做人做事的道理。難得他能不重實利,又苦口婆心導人以道,教完了這裡,又有那裏請他去。他看到自己對別人能有所貢獻,向學之心更深了。

謝振孟給我帶來兩件塵緣,一是戶政系統的用字,一是倉頡輸入法的重編問題。前者我在二十年前就為此得罪權貴,事後也無人能夠接手,一拖再拖,如今終於浮上了檯面。後者則是我的責任,在我被迫出走後,倉頡系統觀念沒人知道,有了問題投訴無門。於是各人自求多福,各照自己的意見,把倉頡碼改出了十多種不同的版本。

戶政是現代化政府的基本要務,真要做,則是困難重重。首先是國內缺乏中文資訊人才,雖然有不少中文電腦公司,說來可憐,這些公司中懂中文的我還沒有見過。

什麼叫做懂中文呢?認識中文字?會寫中文?知道取碼?輸入速度很快?老實說,任何一個人如果不知道中文與資訊之間的體用因果,就談不上是中文資訊人才!

戶政機關很辛苦地在各級地方事務所中,收集了所用的人名,竟然發現有五萬五千多字。好不容易把這些字編成了內碼,一一造了字形,再交給台北及高雄兩市,試作資料建檔,居然發其中還缺少六千多字!

那五萬五千字曾經由行政院主計處核對過,但一到我們手中,就發現其中竟有三百三十多字完全相同,分別排在兩個不同的字面,而且編了不同的內碼!

那麼,那些還沒有被核對,也未經專家評審的六千字,到底原來字集中有是沒有?又應該放在哪一個字面呢?

在圈外人來看,這是個簡單的問題,是嗎?試想有一個大型的集會吧!假定是在沒有現代化設備的深山中舉行,而且一次來了四五萬人。要給這些人造個名冊,絕對不是小事一樁!好不容易造好了,突然又有一些人擁過來,說他們的名字不在名冊當中!

真的嗎?當然要查!怎麼查?名冊是有,但是沒有「字序」(以內碼做字序,恐怕世界上沒有一個人能按順序背出五萬九千個字來)。從何查起?有人說,在電腦中呀!電腦不是很容易查閱嗎?這就是不懂中文資訊的人最直接的反應!

「字序」兩個字人人都認識,但很少人知道它真正的價值。中文最大的缺點,也可以說唯一的缺點,就是沒有字序!有人以筆畫及部首為序,姑不論孰先孰後,查過電話號碼簿的人都知道。當查到貴大姓時,再查到十畫到十五畫的名字時,便必須慢慢地數了。

字序應是「文字的序數,與人熟記的序數相等」,有了字序,人才能隨時知道該文字的排列位置。人需要熟記的序數不多,十進位是一種,九九乘法表是另一種。拼音字母的序數約三十個,從小就背熟了,就如十個數字一樣,一看就知道前後。

凡是超過三十個以上的符號,就很難記憶,中文部首有二百多個,不能做字序。筆畫更不直觀,不僅要會數(寫得正確不見得就數得正確),數時還要花時間。因此用部首、筆畫為索引的字序法,始終不能讓人熟記,更遑論靈活應用!

國人喜歡享用現成的,不事觀念上的改進,便用死方法,硬給每一個中文字形一個內碼。使用時再用內碼表對應各種輸入碼表,有對注音的,有對部首筆畫的。這種方法表面上可以用了,可以賣了,直到下次出問題前,不再有人會過問。

等到新的問題產生時,大家就糊塗了,又有一大堆專家,再建一個對照表。讀者或許無法理解,這樣又有哪點不對?是的,這不只是中文電腦界編碼有問題而已,這是整個時代都有問題,大家只會頭痛醫頭,腳痛醫腳。就像台灣的都市一樣,有地先蓋房子,蓋完再鋪路,路鋪好才發覺電線要埋管,於是再把路挖開。過些時,水管又要挖,水管過後,又是煤氣管。每挖一次勞民傷財不說,工地交通不便,路基越來越壞。不久,捷運工程又成為建設重點,能不挖嗎?挖的結果,有的電不通,有的滲水,有的瓦斯爆炸,有的整個地基崩塌!

每個人都是事後明的專家,而且為了表示自己有見解,群起開罵,罵來罵去,發洩完了,情況依然。幾十年來台灣各種層出不窮的事故,有哪一件不是事先任由少數人一手遮天,沒有全面的規劃,有功吹噓自己,有過推諉他人,最後好官自為!

新字的問題首先是「這算得上是字嗎」?那些新字的「原稿」接近天書,無從查証,也難以認定算不算字!由於這種工作沒有大利,所以沒有專門機構負責。

其次,就算是字,如何取碼?在無輸入碼之前,任何電腦一定查無此號!如果取碼的人不是原始定碼者,麻煩就來了,這個字很可能一收再收,一字多碼!

就算這個問題也解決了,這是個新字,可以放在某一個位置吧!至於為什麼是這個位置呢?有人說那不重要。文字是人應用的概念工具,放是放上去了,卻不知道在哪裏,那不是標準的敷衍塞責嗎?如果要知道在哪裏,則一定要有字序。(就像查英文字典時,一看字就知道前後!)

還有一個尚未發生的問題,目前僅僅台北高雄兩市就已經如此,以後全省實施時又是如何呢?不斷地修改、造字,上千個事務所,未來如何維護?

事到如今,謝振孟是好心,我卻看得明明白白,內政部又揹了一個爛攤子(前一個自然是全民健保)。我能怎樣?時到今日,皮之不存,毛將焉附?我只能在輸入碼上略盡心力,義務替內政部編碼,把字集繼續擴充下去。

資策會受標準局之託,希望能設計一套統一的倉頡輸入碼。此舉立意至佳,只是考慮不週,竟然把我這個發明人給忘了。謝振孟自是感覺不平,我認為他們若真能統一倉頡碼,只要做得更好,我絕不反對。

可是,當謝振孟弄了一份改碼的方案來時,我不能再事緘默了。自從我發表倉頡碼之後,人人都以為編碼非常容易,只要把我已經整理好的規律,搬搬移移,改個名字就行。人的學習能力來自天,能創造一種輸入法,當然不是壞事。可是要把事情做好,卻涉能力、毅力及敬業精神。很多人沒有邏輯思維,也沒有正確判斷的能力,以致常常把很簡單的事,加了很多自以為是的傻見,反而弄得一塌糊塗。

由於戶政司所用的五萬五千多字,沈紅蓮已花了一個月的時間,全部編碼校對完畢。而資策會所做的,也是為了配合戶政系統,如果兩者有矛盾,將來又會有好幾個版本。因此,我不得不厚著臉皮,毛遂自薦,參加了資策會的「倉頡編碼小組」。

除此之外,對中文電腦而言,我已經仁至義盡,今後將全力從事傳統文化的研究。至於其他的技術,我一概傳授給學生,能完成多少全看他們的造化了。

介於電腦與文化之間的,就是中文概念,我畢生絕大部分的時間,都耗費在概念的分析與整理上。受了《易經》的影響,對事物養成了分類的習慣,隨時拿著一把刀,逢事就砍。以至於事事都與他人看法不同,雖有所得,亦有所失。

「倉頡法則」就是中文的功能分類,一般人只知道倉頡輸入法,其實那僅是倉頡法則應用的功能之一。可是不論我怎麼說,人們眼睛沒看到,手沒摸到,總是不願相信的。我年事已高,這些理想可能難以實現,書之於此,說不定未來有人將之發揚光大。

倉頡法則包括文字的六大功能,分別是字碼,字序,字形,字辨,字音,字義。由於理論與實踐涉及太多專業知識及技術,在此僅能概略地介紹。

字碼就是文字的編碼,以供文字實際的應用,包括鍵盤輸入,文字索引等。二十六鍵中我只取用了二十四鍵編碼,餘下兩鍵供擴充之用。

字序是倉頡字母的順序,相當於英文字序,有了字母的觀念後,相應於每一中文字的每一字碼,就有了一定的前後順序。由於我已經把倉頡的著作權放棄了,任何人有興趣都可以用這種順序來編字典、做目錄,歡迎應用。

字形為一種視覺效應,利用明暗、強弱的對比,人得以辨識其特徵而判別其所代表之概念。既然倉頡字母可以用作取碼的符號,也就表示字母中有些性質具有字形的特徵。根據取碼規則,把各種字形符號以程式控制,便可以還原為字形。我的中文大字庫便是利用這種原理,以最直接的手段完成的。

人用眼睛看到字形,便得到一組字碼,如果換了電腦「看到字」,應該同樣可以得到字碼,這就是所謂的字辨,也就是電腦的文字辨識。倉頡碼的符號少,電腦辨識極為容易。電腦辨識的程式,沈紅蓮在大陸時就已經設計好了,可是基於多種原因,我們一直沒有機會把它做成產品。現在已由封家麒負責,將在1995年年底完成,後繼的產品很多,也將一一上市。

字音是供語音輸入之用,中文有百分之九十是形聲字,大約有八千

上一章目錄+書簽下一頁