【編者按】
漢字融入信息時代并非易事。從設(shè)計官話字母方案,在字母打字機上加裝漢字,到圖書館分類、國語羅馬字、漢字拉丁化,直至今天的鍵盤輸入法,中國人經(jīng)過了一個多世紀(jì)的輾轉(zhuǎn)、奮斗。一場全球化技術(shù)變革險些讓漢語被世界拋棄,是那些冒著風(fēng)險重新發(fā)明漢語的流亡者,倡導(dǎo)將普通話作為國語的大膽革新者,還有在牢房的茶杯蓋上設(shè)計漢字輸入碼的電腦工程師,讓漢語為全球貿(mào)易和數(shù)字技術(shù)的現(xiàn)代世界所使用。《漢字王國:讓中國走向現(xiàn)代的語言革命》正是講的這一歷程,它既是關(guān)于漢字本身,也是關(guān)于那些曾經(jīng)努力拯救漢字、帶領(lǐng)我們用漢語開啟屬于自己的未來的人。本文節(jié)選自該書第四章《林語堂與中文檢索的創(chuàng)新》。
中國解決打字和電報問題的辦法都是無奈的權(quán)宜之計,都是設(shè)法調(diào)整漢字來適應(yīng)本是為字母語言設(shè)計的技術(shù)。打字和電報都是供另一類文字使用的系統(tǒng),作為后來者的中國自然處于劣勢,克服這樣的劣勢也就成了中國發(fā)明者和語言學(xué)家的努力目標(biāo)。但是,許多人猜想,問題會不會在于漢字本身。
西方人說漢字不夠快捷、簡單、高效——總而言之不夠現(xiàn)代。中國國內(nèi)對漢字最激烈的批評者也毫不留情。他們指責(zé)漢字系統(tǒng)危及中國未來的生存。許多人同意據(jù)說是作家兼知識分子改革者魯迅說的話:“漢字不滅,中國必亡!”這種緊迫感在19世紀(jì)晚期王照那一輩人當(dāng)中已經(jīng)明顯可見,在1912年至1949年的民國時期愈加突出。1928年,12年的軍閥割據(jù)終于結(jié)束。但中國喘息未定,日本就于20世紀(jì)30年代初入侵了中國東北,然后是太平洋戰(zhàn)爭……至少有20年的時間,中國一直深陷境內(nèi)外的生死之爭,那些戰(zhàn)斗對20世紀(jì)下半葉產(chǎn)生了決定性影響。那段時間不是務(wù)虛探討新思想或哲學(xué)理論的時候。務(wù)實行動與民族生存壓倒一切。
國家、民族處境危殆,這一點深入人心,但中國人不相信把漢字和民族歷史一并拋棄能夠確保中國走向未來。比較溫和的知識分子發(fā)問,漢字真的無可救藥了嗎?真的一文不值,應(yīng)該像有些人鼓吹的那樣和中國的古典學(xué)問一起扔進垃圾堆嗎?
溫和派認(rèn)為,語言的挑戰(zhàn)在于漢字本身。漢語的聲調(diào)和同音字太多,漢字太難寫,學(xué)漢語用的時間太長,但這些并非問題的全部。如果漢語系統(tǒng)有章可循,這些問題就都算不得大事。真正的問題是如何組織漢語這個沒有清晰結(jié)構(gòu)的語言。漢字的數(shù)目幾乎無窮無盡,若不確定漢字的數(shù)目,就無法將它們組織起來或使之順利融入機器設(shè)計和技術(shù)。那好比還沒弄清楚問題的各個方面就想找到解決辦法。
漢語文字系統(tǒng)需要由母語是漢語的人來徹底審視。對于這項任務(wù)的真正性質(zhì),西方字母使用者理解不了,因為他們習(xí)慣于用26個字母整齊利落地組成各種固定組合。要稍窺相關(guān)的挑戰(zhàn),可以做一個簡單的練習(xí):選一個單詞,在英語詞典里找這個詞,然后想一想這個過程是多么容易?!癰”絕不會出現(xiàn)在“a”前面,“g”永遠在“f”和“h”之間,“t”總是緊跟在“s”后面。由于這種可預(yù)見性,可以在詞典上從左到右找到正確的首字母部分,并按照同樣的邏輯在該部分中找到正確的單詞。如果一個單詞和另一個單詞的頭幾個字母一樣,如“address”和“adrenaline”,只要向右去找到它們之間第一個彼此不同的字母就好了。用排除法一個字母一個字母地查找英語單詞的過程基本上是自動的,一個字母就是一步??梢杂?6個字母建造、儲存、查找自己想要的所有單詞。這個系統(tǒng)的一個基石是熟記26個字母,而這很可能上幼兒園的時候就做到了。
字母的直線型組織不可違逆??偸菑摹癮”開始,到“z”結(jié)束,就連提到字母也總是說“ABC”,不會說“CBA”或“UVW”。這條規(guī)則可以用來組織從分點演示到購物清單的任何東西。簡言之,字母順序?qū)τ谛畔⒌慕M織、識別和排列至關(guān)重要。不僅詞典如此,電話本、名錄、索引系統(tǒng)、百科全書、電腦文檔等任何需要順序和條理的東西均是如此。
現(xiàn)在打開一本漢語字典。第一步:看通常位于字典前面或后面的部首表,找到要查的字的部首,那可以是按筆畫由少到多排列的214個(曾經(jīng)是540個)部首中的任何一個。第二步:那個部首帶著一個數(shù)字,按照那個數(shù)字來到另一張表,此時還不到字典正文。那張表中,部首下面列出了所有包括該部首的字,有的部首下只有一個字,有的部首下的字多至64個。那些字也都是按筆畫數(shù)目從少到多排列的。第三步:在部首表中找到了你想找的字后,再去字旁標(biāo)的字典的那一頁。除非你看一眼那個字就知道它的筆畫是多少,否則你得看遍那一頁上所有的字才能找到你要的那一個。查一個字要翻好幾頁。你若是有耐心,再加上運氣,也許第一次就能查到。
當(dāng)然,有好幾處可能出錯的地方。可能你不能肯定想查的字的哪個部分是部首,因為就連母語是漢語的人有時都搞不明白。這一步錯了,你就走上了歧路,可能到了第三步才意識到自己的錯誤。有時,一個字本身就是部首,這也會令你疑惑迷茫。
然而,假設(shè)你沒有遇到上述的任何困難,因為你知道正確的部首,也知道如何在字典中查到那個部首,但你也許不記得要查的字的其他部分的樣子,因此不知道確切的筆畫數(shù)目。在不同的字里,同樣的部首有時會以不同的形狀和大小出現(xiàn)——漢字又一個惱人的特征。彼此毫無關(guān)系的部首也可以看起來很相似,試想對一個初學(xué)者解釋“艸”和“艸”其實都是“草”字頭,“月”是“肉”的另一種寫法,或者“口”與“囗”毫不相干,盡管前者看上去只是比后者小一點而已。所有這些潛在的陷阱都是漢字所固有的,因為每個字都由大小形狀各不相同的部分組成,那些部分以不同的比例填滿一個方塊。
反過來想:如果字母沒有固定順序會是什么樣子?如何組織26個字母,按照什么標(biāo)準(zhǔn)來組織都將成為沒有定論的問題:排序是根據(jù)使用的頻率,形狀的復(fù)雜程度,還是一個字母上半部或下半部突出部分的數(shù)目?情況驟然雜亂起來,更接近漢語的一貫狀態(tài)。
如果按照形狀來分組,那么“C”“G”“O”“Q”的大寫字母肯定應(yīng)該排在一起,因為它們有著類似的圓形輪廓?!癙”和“F”都是頭重腳輕,是否該排在一起?還是說應(yīng)把“P”和“B”排在一起,因為“P”只比“B”少一個半圓?這樣看來,“K”和“R”在字母表中也應(yīng)該挨得更近一些,因為它倆下半部都有伸出來的一道斜杠。如果有人反對,說形狀和外觀太主觀,全靠觀者的眼光,此言雖有理,卻引出一個要求,即需要深入字母的結(jié)構(gòu),將其分解成各種筆畫,以更好地顯示字形的一致性。這需要真正的思維改變。
我們通常不認(rèn)為字母能夠分解為筆畫,因為字母被視為基本單位。把“A”分解為兩條斜線和一條短橫線,或把“B”分解為一條豎線和兩條曲線沒有任何意義,因為字母的價值在于它們代表的發(fā)音,不在于形狀??墒亲帜副旧硪彩怯晒P畫組成的??梢哉f筆畫是字母備受忽視的屬性。一畫是任何一種連續(xù)的線,無論是直線還是曲線,長線還是短線,有時甚至是折線。大部分字母由1到3個筆畫組成(“E”是例外,有4畫)。
如果按照筆畫數(shù)目從多到少來組織字母,那么字母表的開頭就應(yīng)該是“E”而不是“A”,后面跟著“F”、“B”或“H”,它們都有3個筆畫。如果字母表是EFBH而不是ABCD,就得立即把“最優(yōu)的”(A-list)或后備計劃(planB)這些字眼從英語中剔除出去。學(xué)校里的老師不會用“優(yōu)”(A)打分,公司也不會有C級股票。字母表的次序不僅重要,而且這種次序已深深植根于語言之中,塑造著我們在世界中的定位,我們表達優(yōu)先的方式,以及我們按照重要性、偏好和等級制這些標(biāo)準(zhǔn)對事物的組織。
但是,“E”在字母表中是否應(yīng)該名列第一也取決于采用哪種寫法。此處,正字法構(gòu)成了對筆畫數(shù)目的挑戰(zhàn)。按照印刷體寫“E”,需要寫4筆。但若用手寫體,寫得像是翻轉(zhuǎn)過來的“3”,那么一筆就夠了。若是以手寫體為準(zhǔn),“E”就要被拉下字母表之首的寶座,放到后面去和“C”“O”“U”“V”“W”“Z”這些一筆字母為伍。所以,隨著字母的結(jié)構(gòu)分析趨向復(fù)雜細微,字母該如何寫,該按照何種順序,這種正字法的規(guī)則變得更加重要。
計算筆畫數(shù)目也許看似專斷、主觀、不可靠,因為它取決于寫字的人和書寫習(xí)慣,那么不妨鉆牛角尖鉆得再深一點,看一看筆畫是什么樣的,然后試著通過更加精微的分析提出規(guī)則:筆畫是直線,像“L”,還是曲線,像“C”或“S”,還是直線和曲線的結(jié)合,像“D”“Q”“J”“U”“R”;再進一步,可以看一看字母是不是不僅是直線的,而且是垂直直線的,像“I”“L”“T”,或是直線帶角度的,像“A”和“Y”,或是直線帶拐彎的,像“Z”;甚至可以更深入探究,看一看不同筆畫之間的交錯關(guān)系,是像“T”那樣在某一點上接觸,還是像“X”那樣交叉穿過,是像“C”那樣不封口,還是像“O”那樣完全閉合?盡可以按需要混搭各種標(biāo)準(zhǔn),但要做好出現(xiàn)例外的準(zhǔn)備,因為沒有一條規(guī)則能涵蓋全部情況,包括字母表必須是固定的一套字母的想法。
筆畫、筆畫數(shù)目、筆畫順序、筆畫類型、寫法上的不一致、書法藝術(shù)、界定一套固定的語言學(xué)單位,這些都是中國人從開始學(xué)寫字就要克服的障礙。中文打字機和漢字電碼的發(fā)明者各自處理了這些問題的某些方面,卻都未正面或徹底解決這些問題。他們是務(wù)實派,達到了目的就收手。然而,在他們努力的同時,對此問題極為關(guān)注的一些人正在對漢語進行徹底的重新審視,這些人是每日都與文字和書籍打交道的圖書館員和索引編制者,他們的專業(yè)是組織、分類和儲存知識系統(tǒng),所以他們對漢字系統(tǒng)的分析比其他人更加詳細精微。
圖書館員是中國文字傳統(tǒng)的監(jiān)護人,他們當(dāng)然不想拋棄漢字或中國本土的知識系統(tǒng)。他們認(rèn)識到,必須找到辦法讓漢語得以進入現(xiàn)代技術(shù)環(huán)境。然而,如果他們想保留過去的傳統(tǒng)不予丟棄,就必須想辦法重新組織漢語以供系統(tǒng)性使用。要使?jié)h字和字母一樣好用,等于把兩個距離遙遠的世界聚到一個書架上。嘗試改變的人中有幾個早早地認(rèn)識到,中國與世界和平共處的關(guān)鍵也許就在于小小的筆畫。要為漢語創(chuàng)立成功的歸檔系統(tǒng),圖書館員是合適的人選,但首先要有人提出這個主意。一位年輕的英文教師無意間成了領(lǐng)頭人。
1917年,23歲的林語堂在《新青年》雜志上發(fā)表了自己的第一篇作品。這份雜志兩年前在上海法租界創(chuàng)刊,給中國躁動不寧和聰穎卓絕的青年人提供了一個平臺。雜志除中文刊名外還有同樣語義的法文刊名“La Jeunesse”,顯示了帶有馬克思主義鋒芒的世界性風(fēng)格。在這本封面加紅套印的平裝雜志上,勤于思考的年輕人發(fā)文表達激進觀點,介紹西方思想,質(zhì)疑傳統(tǒng)知識。主編把雜志的使命說得很清楚:如果中國必須丟棄過去所有傳統(tǒng)的沉重包袱方能與外部世界競爭,那也只好如此。
與各種激烈批評傳統(tǒng)文化的文章相比,林語堂的文章沒有那么慷慨激昂。他選擇了一個看似無害無趣,更適于圖書館工作者思考的題目——《漢字索引制說明》。同期雜志上的另一篇文章更吸引眼球,因為它介紹了法國哲學(xué)家亨利·柏格森(Henri Bergson)關(guān)于時間的內(nèi)部體驗學(xué)說,這個學(xué)說看起來足夠新穎。林語堂那篇7頁長的文章沒有提出什么振聾發(fā)聵、令反叛青年趨之若鶩的主張,但它后來做到了雜志中任何其他文章都做不到的事:它不可逆轉(zhuǎn)地改變了新舊知識的景觀。
林語堂的提議乍看似乎簡單,但其實可以算是一份組織漢字的完整指南。他把漢字分解成筆畫,確定了5類筆畫:橫、直、撇、點、勾。這里隱約可見傳統(tǒng)上教授書法時使用的永字八法的痕跡??墒橇终Z堂給他的5類筆畫界定的范圍要寬得多,他注意的是筆畫的方向,不是筆畫的樣式。例如,一橫不僅包括明顯的一道橫線,如漢字的“一”,而且包括任何從左到右以類似的動作寫出的筆畫,不一定是平的。
數(shù)千年的書法練習(xí)使得筆畫和筆順根深蒂固,發(fā)展出了一套先寫哪筆,后寫哪筆,直至完成全字的固定規(guī)則。在英文書寫中,可以想象寫字母“A”時先寫中間的小橫,但常規(guī)寫法是先寫左邊的斜線,后寫右邊的斜線,最后寫連接這兩條斜線的小橫線。同樣,寫字母“X”的時候先寫哪一筆都可以,結(jié)果毫無差別。但是,手寫漢字時,筆畫和筆順嚴(yán)格得多。林語堂用一個字的首筆畫作為第一分類依據(jù),卻發(fā)現(xiàn)分得不夠細。于是他在那5個基本筆畫的基礎(chǔ)上加以擴大,確定了19個首筆畫,囊括了所有漢字書寫的第一筆。
接下來林語堂把第一筆和第二筆放在一起,找出了28個頭兩筆的格式,幾乎適用于所有漢字。這如同先分出所有以一條豎線開始的字母:“B”“D”“F”“H”“K”“L”“M”“N”“P”“R”。然后加上第二條規(guī)定:第一筆豎線后必須是曲線,這樣前述那些字母就剩下了“B”“D”“P”“R”。用確定的一套頭兩筆組合來辨識漢字,如此產(chǎn)生的組織格式與字母的邏輯不相上下。
林語堂這個簡單明了的辦法向數(shù)千年來研究、學(xué)習(xí)和規(guī)范漢字的傳統(tǒng)提出了挑戰(zhàn)。他顯示了漢字如何可以按照其自身組織來分類,而不必依賴其他外在的原理,無論是西方字母還是代碼。在字典中分類查找漢字從來都是靠部首。在林語堂之前,沒有一個中國人提出過他這樣完整的替代部首制度的方法。祁暄僅僅是開了個頭。
林語堂在5個基本筆畫的基礎(chǔ)上確定的19個“首筆畫”。
傳統(tǒng)上,分類所依靠的原理因多年的習(xí)慣和文化實踐積淀而成,而非來自抽象的語言理論。語文學(xué)和詞典學(xué)是中國經(jīng)典學(xué)問的核心,文字本身也是研究的對象。許多個世紀(jì)以來,學(xué)者們努力通過證實某個字的意思來保存古人的智慧,這是訓(xùn)詁學(xué)這門備受尊敬的學(xué)問的關(guān)鍵。印刷術(shù)發(fā)明之前,此事的難度超乎想象。即使手抄本的字體依照規(guī)范,仍舊有許多筆畫差那么一點。一橫寫成一撇能引得以后好幾代學(xué)者對這到底是什么字爭吵不休。
管理漢字的全部詞匯枯燥無味,吃力不討好。把字詞整理記錄成詞匯表是對漢語知識基礎(chǔ)的重要支撐。這項工作是對漢語詞匯的必要維護保養(yǎng),需要懷著負責(zé)任的精神耐心地、不厭其煩地反復(fù)比較對照,細致入微地分門別類。所有這些一絲不茍的工作都遵循著一條基本規(guī)則。兩千年來,作為漢字一部分的部首一直是分類的唯一標(biāo)準(zhǔn)。最早的漢語書寫出現(xiàn)后大約1100年到1500年,部首得到了確定,當(dāng)時用于管理內(nèi)務(wù)。那時漢字的數(shù)量已經(jīng)相當(dāng)可觀。
第一個匯編部首的人名叫許慎,是東漢時期的大儒和經(jīng)學(xué)家。因為之前無人對漢字做過總結(jié)或研究過漢字的用法,所以許慎確定了540個部首來厘清混亂無序的9353個漢字。他深信,必也正名乃天下至道。這個信念深刻影響了他的組織準(zhǔn)則。據(jù)說540這個神奇的數(shù)字來自代表“陰”“陽”的6和9相乘之積,再乘以10,它留出了足夠的類別數(shù)目。他的制度從部首“一”開始,象征著萬物之源,到代表時光循環(huán)的12個部首結(jié)束,形成了制度在概念上的完整性。
簡而言之,部首是神圣的,上千年來一直得到尊重和遵守。不過,時常有人發(fā)問:為何要有如此多的部首?到底多少部首最為合適?對此眾說紛紜。10世紀(jì),一位僧人把部首數(shù)目從540減到了242,近500年后,一對父子選擇了444這個數(shù)字。最后的214個部首是明朝時確定的,由太學(xué)生梅膺祚整理編入了自己編纂的《字匯》之中。到18世紀(jì),愛書如癡的康熙皇帝采納了214個部首的制度,命人編纂一部以他命名的權(quán)威性字典,由此確立了214個部首的權(quán)威地位。
到20世紀(jì)早期,部首制度開始現(xiàn)出裂痕。幾個世紀(jì)以來,人們一直在修改、補充、調(diào)整部首制度,以維持它的可行性,但這個制度學(xué)習(xí)和使用起來仍然費時費力。沒有易于掌握、有章可循的規(guī)則來儲字檢字,也沒有合理的辦法來管理浩如煙海的字軸和書籍中用漢字記載的大量故事、歌謠和王朝歷史。
中國人在聽說亞里士多德的分類學(xué)或梅爾維爾·杜威(Melvil Dewey)的十進分類法之前,很早就有了自己組織典籍的方法。他們不像杜威那樣依靠數(shù)字和小數(shù)點,也不像查爾斯·A.卡特(Charles A. Cutter)那樣使用字母。卡特在1880年前后開始使用字母來標(biāo)識不同的題材,后來他的制度成為美國國會圖書館目錄制度的基礎(chǔ)。中國真正的書目分類始于公元前1世紀(jì),建立在道德秩序的概念之上。一位儒學(xué)家設(shè)計了一套復(fù)雜的制度,有7個大類,下分38個小類。儒家經(jīng)典居于首位,包括天文學(xué)、風(fēng)水占卜、藥理學(xué)、性學(xué)在內(nèi)的科學(xué)和醫(yī)學(xué)敬陪末座。兩個世紀(jì)后,一位秘書監(jiān)把被稱為“七略”的七類縮小為更簡練的“四部”,即四類。幾經(jīng)調(diào)整后,四部被確定為延續(xù)至今的形式:經(jīng)、史、子、集。四部之下分別收藏了海量書籍和記錄。據(jù)報告,到15世紀(jì)末,中國產(chǎn)出的書目和冊數(shù)比世界上所有其他國家加起來都多。
18世紀(jì),中國執(zhí)行了一項巨大無比的皇家藏書項目,經(jīng)、史、子、集四部實現(xiàn)了標(biāo)準(zhǔn)化。在《四庫全書》的編纂過程中,大批學(xué)者奉命在四部的各部之下進行編集?!端膸烊珪饭舶?萬卷書,歷時10年終得完成。四部的次序反映了它們的重要性等級。這種以儒學(xué)為尊的書目制度在以中國為中心的世界中合情合理,但用生活在20世紀(jì)第二個十年的林語堂的眼光來看,它與西方的圖書館制度相比,在現(xiàn)代沒有多大用處。
在1917年刊登在《新青年》上的文章中,林語堂把漢字和漢語信息管理視為同一個問題。若能輕易地在字典里找到一個字,同樣可以很快找到一本書書名中的第一個字。所以,解決前一個問題的辦法一定能夠解決后一個問題,而辦法從來就擺在那里,那就是漢字的結(jié)構(gòu)。林語堂表示,漢字完全可以應(yīng)付現(xiàn)代的挑戰(zhàn)。它的進步無需任何外援,不用羅馬字母,不用數(shù)字,也不用代碼。漢語不需要其他表現(xiàn)方法,它自己特有的筆畫和筆順就足夠了。
林語堂的主張立即引起了共鳴。在中國深陷疑惑與焦慮之時,他的主張給人們帶來了希望、慰藉,甚至信心。新文化運動的一位領(lǐng)袖錢玄同看到,林語堂的思想遠超同時代的人,對這位年輕的索引編制者贊不絕口。一時間稱譽四起。德高望重的教育改革家蔡元培指出,林語堂不僅重新構(gòu)想了筆畫的功能,而且他的辦法詳細展示了筆畫如何引領(lǐng)并構(gòu)成一個字的全部輪廓。林語堂發(fā)現(xiàn)的漢語表意文字的邏輯足以媲美西方字母的組織能力,卻一個拉丁字母都不用,這是何等的巧思啊。
從康奈爾大學(xué)留學(xué)歸來的庚款留學(xué)生胡適的看法最深刻。他看到,林語堂研究的是使中國的往昔得以延續(xù)到未來的基礎(chǔ)結(jié)構(gòu)。林語堂的成就是認(rèn)識到漢字有自我組織的能力,能夠用來在中國浩大而豐富的知識基礎(chǔ)內(nèi)存儲、搜尋、分類、選擇并查找想要的信息。這個能力可以擴展到各種排序系統(tǒng),甚至是其他語言的排序系統(tǒng)。也可以借此能力恢復(fù)中華知識寶庫的文化力量。胡適說,林語堂的索引制是打開其他門的那扇門,是被批評傳統(tǒng)的人忽略了的奠基工作:
“整理”是要從亂七八糟里面找出一個條理頭緒來;從昏亂糊涂里面查出一個明確意義來……最沒有趣味,卻又是一切趣味的鑰匙;最粗陋討人厭,卻又是一切高深學(xué)問的門徑階級……這樣的努力中最困難又最不可缺少的是漢字的重組……即漢字的分類與組織。
現(xiàn)代壓力逼迫中國與傳統(tǒng)決裂,全中國如履薄冰。值此危難之際,眾多革命者奮起行動,為事業(yè)拋頭顱灑熱血。林語堂與他們不同。他對重建中國的貢獻是幫助拯救中國的傳統(tǒng)與遺產(chǎn),使之不致湮沒。
《漢字王國:讓中國走向現(xiàn)代的語言革命》,[美]石靜遠著,林華譯,中信出版集團2023年8月。