潘悟云(澎湃新聞 蔣立冬 繪)
4月25日,復(fù)旦大學(xué)金力院士團(tuán)隊(duì)在《自然》雜志發(fā)表了以《語言譜系證據(jù)支持漢藏語系在新石器時(shí)代晚期起源于中國北方》為題的論文,揭示了世界第二大語系漢藏語系分化成現(xiàn)代語言的最早年代和地點(diǎn),這是中國語言學(xué)的研究成果首次在《自然》發(fā)表,引發(fā)了廣泛的關(guān)注和討論。對此,《上海書評》采訪了論文團(tuán)隊(duì)重要成員、復(fù)旦大學(xué)人文社會科學(xué)數(shù)據(jù)研究所東亞語言數(shù)據(jù)中心負(fù)責(zé)人潘悟云教授,請他介紹這一研究的相關(guān)情況。
《自然》官方網(wǎng)站頁面
《語言譜系證據(jù)支持漢藏語系在新石器時(shí)代晚期起源于中國北方》一文在《自然》發(fā)表之后,引起很多人好奇:為什么語言學(xué)這種“文科”的研究成果,能夠在頂級的理工科學(xué)術(shù)雜志發(fā)表?
潘悟云:我們這篇論文看上去是語言學(xué)研究,其實(shí)是人類學(xué)研究,關(guān)注人類早期語言的形成,特別是東亞語言當(dāng)中漢藏語尤其是漢語的形成。
我們都知道,人類學(xué)分為好多種,既有你說到的“文科”——文化人類學(xué),也有體質(zhì)人類學(xué)、分子人類學(xué)。我所在的復(fù)旦研究團(tuán)隊(duì)主要做的是分子人類學(xué),關(guān)注的是基因的構(gòu)成,這次研究成果發(fā)表之后,可能會進(jìn)一步關(guān)注體質(zhì)人類學(xué),就是人的外貌、身高、膚色、發(fā)色,等等,這些實(shí)際上都屬于自然科學(xué)的范疇。
至于語言屬于什么學(xué)科范疇,其實(shí)很難說——它是跨類的,一頭伸進(jìn)自然科學(xué),如語音合成、語音識別,都是計(jì)算機(jī)學(xué)科在做;一頭伸進(jìn)人文社科,涉及人的社會特性。正因如此,語言學(xué)就有很特殊的意義,它是溝通文科理科的橋梁。另外,它也的確是一個(gè)很值得研究的對象。人類一產(chǎn)生,就同語言掛鉤。我一直說,人類同動物的區(qū)別,就在于語言。以前都說區(qū)別在于人類會制造工具,現(xiàn)在發(fā)現(xiàn)很多動物不僅會利用工具,也會制造工具。而人類的語言和動物有本質(zhì)不同。動物也有傳遞信息的工具,比如猿猴發(fā)出各種聲響、蜜蜂跳出各種舞蹈,它們用各種方式傳遞信息。人類語言具有模式二重性。動物用一種聲音來代表一種事物、一種現(xiàn)象,聲音和事物、現(xiàn)象是一對一的關(guān)系。人類語言則有雙層結(jié)構(gòu),語音先構(gòu)成具有某種意義的語素,語素再與具體的事物、現(xiàn)象關(guān)聯(lián)。這樣,通過這種意義組合,可以表達(dá)大千世界的諸多概念。
我曾經(jīng)猜想,人類產(chǎn)生之初,有各種的人,考古發(fā)掘已經(jīng)發(fā)現(xiàn)了很多古人類,這些古人類與現(xiàn)代智人相比有許多優(yōu)勢,例如尼安德特人的力氣比智人要大,但是前者在與后者的競爭之中逐漸消亡,最重要的原因就是語言。智人通過語言,能夠有效地交流、溝通,將發(fā)明創(chuàng)造保存和傳遞下去。有了語言,才有文字,才有文獻(xiàn),進(jìn)而才有文化和文明——所謂文化,本質(zhì)就是一代代能傳下去的、大家形成的知識。所以,很多學(xué)者關(guān)心語言的起源問題。關(guān)心語言起源,就意味著關(guān)注人類的起源、文明的起源。這些問題,不管什么學(xué)科,都會共同關(guān)注。
既然如此,想請您簡單介紹一下,學(xué)者是如何針對語言起源問題展開研究的。
潘悟云:關(guān)于這個(gè)問題,最開始大家都是猜測,提出各種假說。有人說是游戲產(chǎn)生的,有人說是勞動產(chǎn)生的。以至于巴黎的語言學(xué)會一度禁止這方面的討論,因?yàn)檫^于主觀,與近代科學(xué)思潮不相符。好在隨著科學(xué)的發(fā)展,產(chǎn)生了現(xiàn)代語言學(xué),也就有了許多科學(xué)方法來推測語言從何時(shí)起源、最初的形式如何。這里面尤其值得一提的,是十九世紀(jì)的歷史比較法。這種研究方法的基本思路,是對眾多現(xiàn)代語言的共同特征加以比較。學(xué)者猜測,現(xiàn)代語言的共同特征不是偶然產(chǎn)生的,而是來源于早期的共同語。這方面的代表性學(xué)者是威廉·瓊斯(William Jones),他在東印度公司工作時(shí),看到梵文與拉丁文、古希臘文有相似之處,猜測它們一定有共同祖先。后來,有許多語言學(xué)家通過大量比較,參之于古代文獻(xiàn),將古代的共同語構(gòu)擬出來。這是很科學(xué)的做法。迄今為止,我們進(jìn)行語言歷史研究的時(shí)候,歷史比較法還是最重要的一種方法。
但是,歷史比較法也有局限性,它只能解決語言的譜系問題。它根據(jù)不同的現(xiàn)代語言的同源詞多少,來推斷這些語言之間的親疏遠(yuǎn)近關(guān)系,然后畫出譜系樹。這里面的道理很簡單:如果一群親屬語最早來自同一種語言,后來才分化,那么這些語言最初的詞匯肯定是相同的。分化以后,由于語言是不斷變化的,過去相同的詞匯不斷地流失。分化早的,流失的就多,分化晚的,流失的就少。所以,憑語言中同源詞的多少,大體上可以斷定語言分化的早晚。
但是這種方法解決不了分化的年代問題。例如,印歐語分化成十個(gè)語族,是什么時(shí)候開始的,斯拉夫語族分化為俄語、波蘭語、捷克語,是什么時(shí)候開始的?分化的地點(diǎn)問題也很難解決。例如,印歐語誕生地的確定,靠的還是這些語言所共有的生物,其中最重要的是山毛櫸與鮭魚,語言學(xué)家根據(jù)這些動植物的分布,把印歐語的起源地鎖定在維斯杜拉河與易北河之間的地域。地點(diǎn)確定以后,根據(jù)考古學(xué)的證據(jù),這些地區(qū)在公元前3000年以前才出現(xiàn)印歐語中普遍出現(xiàn)的馬與羊。于是語言學(xué)家認(rèn)為,印歐語在公元前4000年晚期開始在德國波羅的海沿岸使用。但是,這些方法都不是語言學(xué)本身的。
那么,這個(gè)問題是如何得到解決的呢?
潘悟云:一直到二十世紀(jì),美國的斯瓦迪士(Morris Swadesh)提出一個(gè)新的方法——語言年代學(xué),語言的發(fā)生年代才能夠得到確定。要理解這個(gè)方法,可以參照地質(zhì)學(xué)用放射性物質(zhì)碳14對年代的測定?;钌矬w內(nèi)的碳14的含量是固定的,死了之后,體內(nèi)碳14衰減的速度是恒定的。打個(gè)比方來說,如果考古隊(duì)從地下挖出一頭鹿,根據(jù)碳14的現(xiàn)存含量與衰減速率,就能算出這頭鹿的死亡時(shí)間。那么,語言學(xué)變化的速度,是不是也像碳14那樣,是恒定的呢?如果是的話,那么,根據(jù)兩種語言中現(xiàn)存同源詞的多少,就可以知道它們分化的時(shí)間。
斯瓦迪士給語言學(xué)找到的碳14,就是“核心詞”,或者“核心語義”。人類認(rèn)知的共同性,決定了有些詞大家都會常說。比如太陽、月亮、身體部位名稱,還有人稱代詞、數(shù)詞,這些都是核心語義,而且變化比較慢,原因在于人的交際需要。比如,小孩今天晚上叫“媽媽”,明天上午叫“嬤嬤”,媽媽就聽不懂了,最核心的語義一定是變得比較慢的。斯瓦迪士經(jīng)過統(tǒng)計(jì),認(rèn)為核心語義的變化速率也是恒定的,于是提出一個(gè)語言年代學(xué)的公式,利用這個(gè)公式,通過計(jì)算兩種親屬語言中現(xiàn)存的同源詞多少,來計(jì)算分化的年代。
但是,這種方法遭到了很多質(zhì)疑。第一個(gè)原因是,語言的變化速度肯定是不一樣的。戰(zhàn)爭頻繁的地方,語言變化的速度就快,一打仗人死光了,其他地方的人遷移過來,語言就發(fā)生變化了。中國歷史上大的動亂,例如唐朝的安史之亂、黃巢起義,北宋的靖康之難,都導(dǎo)致了北方移民大量南下,一旦與當(dāng)?shù)厝私佑|,就會引起語言的借用。第二個(gè)原因是,詞匯的變化速度也不一樣,核心詞變得慢一點(diǎn),文化詞就變得很快。甚至有些印歐歷史比較語言學(xué)認(rèn)為很穩(wěn)定的詞,實(shí)際上并不穩(wěn)定,比如說人稱代詞。漢語里的第三人稱先秦還沒有,出現(xiàn)時(shí)已經(jīng)很晚了。上海人喜歡說的“儂”最早是第一人稱,古吳語以“儂”或“阿儂”表示“我”,現(xiàn)代上海話“儂”則變成了第二人稱“你”。所以印歐語中一些最穩(wěn)定的語義,在漢語中就不一定如此。
盡管如此,我們還是采用了斯瓦迪士的理論。不少中國學(xué)者,如孫宏開、黃布凡、鄭張尚芳等,都認(rèn)識到斯瓦迪士的理論對東方語言不完全適用,進(jìn)而提出了東亞語言的核心詞。但是我們認(rèn)為,絕大部分核心詞全世界都是一樣的,如太陽、月亮,大家都常用,例外只是少數(shù)。中國學(xué)者提出的核心詞同斯瓦迪士相比,絕大部分也還是一樣的。
具體計(jì)算年代的方法,我們采用的是貝葉斯統(tǒng)計(jì)方法。我在網(wǎng)上看到了不少評論,很有意思。比如有一位學(xué)者,他看到我們用了貝葉斯統(tǒng)計(jì)方法,大約在網(wǎng)上檢索了一番,發(fā)現(xiàn)貝葉斯學(xué)派是“主觀概率學(xué)派”,就認(rèn)定我們是在“主觀”臆測。實(shí)際上,主觀概率學(xué)派相對于頻率學(xué)派而言,是對概率論的一大發(fā)展,在無法通過重復(fù)試驗(yàn)得出概率的情況下,根據(jù)有限的觀察提出一個(gè)主觀假設(shè),通過大量的材料不斷作出修正,逐漸逼近事實(shí)。這更接近經(jīng)驗(yàn)科學(xué)的普遍做法。就算相對論也是一種假設(shè),還在不斷接受經(jīng)驗(yàn)世界的檢驗(yàn)。這個(gè)方法首先用在物種分化,后來語言學(xué)也采用了,并且產(chǎn)生較大的影響。
有了這種語言譜系樹,還可以用譜系地理學(xué)(phylogeography)的方法推斷分化的地理位置。譜系樹上最接近的語言,通常地理距離也比較接近。例如,上海與蘇州地理上比較接近,語言也比較接近。上海與廣州,距離比較遠(yuǎn),語言的關(guān)系也比較遠(yuǎn)。當(dāng)然,也會有不同的情況,武漢與昆明的距離比較遠(yuǎn),語言卻比較接近。但是大多數(shù)的情況下,語言的距離與地理的距離是相關(guān)的。同時(shí),這種方法還假定,原始人從一個(gè)地方開始向四處分化的時(shí)候,他們的遷移是隨機(jī)性的。根據(jù)這些假設(shè),我們算出原始漢藏語的發(fā)源地在四川一帶。但是,漢藏人向四處遷移并不是很隨機(jī)的,更多的是從北向南遷移。所以,漢藏人的發(fā)源地一定在四川以北,即陜甘寧一帶,就是仰韶與馬家窯文化的分布區(qū)域。
漢藏語系語言的分化與中國西北、西南地區(qū)的人口擴(kuò)張相關(guān)
關(guān)于研究團(tuán)隊(duì)的構(gòu)成、不同成員的分工,能麻煩您介紹一下嗎?
金力團(tuán)隊(duì)合照,左起:嚴(yán)實(shí)博士、金力院士、潘悟云教授、張夢翰博士
潘悟云:金力教授統(tǒng)領(lǐng)整個(gè)研究團(tuán)隊(duì)。他一直關(guān)注人群的遺傳結(jié)構(gòu)、人群的遷徙和自然選擇這些問題。斯坦福大學(xué)的卡瓦利·斯福扎(Cavalli-Sforza)是以分子人類學(xué)解構(gòu)語言、從基因角度研究人類演化的鼻祖,金力教授做博士后研究就在斯福扎的實(shí)驗(yàn)室。上世紀(jì)九十年代,金力教授采集了十萬例東亞人基因,研究之后得出結(jié)論:整個(gè)東亞地區(qū)的各個(gè)人種都是從非洲遷移過來的,一下子推翻了中國人由“北京猿人”演化而來的假說。
1996年,金力教授回國之后,在《文匯報(bào)》發(fā)表了一篇關(guān)于東亞人來自非洲的文章,我讀到之后,很振奮,因?yàn)樗龅难芯颗c我的研究是互相印證的。亞洲大陸的幾個(gè)語系,阿爾泰語系、漢藏語系、南亞語系和南島語系,傳統(tǒng)觀點(diǎn)認(rèn)為,說這些語言的人種沒有什么發(fā)生學(xué)上的聯(lián)系,因而這些語系當(dāng)然是毫無關(guān)聯(lián)的。比如,過去大家都認(rèn)為,爪哇猿人和北京猿人是兩個(gè)人種,那么南島人和中國人作為他們的后裔,也應(yīng)該說兩種不同的語言。但是后來我們發(fā)現(xiàn),南島語系和漢語的一些核心詞很接近,這一點(diǎn)是法國語言學(xué)家沙加爾(Laurent Sagart)最早提出來的。舉兩個(gè)例子,女性生殖器涉及人類的繁衍,是很重要的詞,國內(nèi)說的最多的發(fā)音就是pi,現(xiàn)在的南島語也說pi;女性的乳房涉及哺育后代,也是很重要的詞,上古漢語的發(fā)音是njo,南島語是nu。
漢語和南島語有這么多核心詞相似,過去一直讓我很困惑。讀到金力教授的文章以后,我就明白了,原來他們都是從同一祖先演化來的。后來金力教授很快就和我見面了。要探索文明起源,文獻(xiàn)、考古這些傳統(tǒng)手段都存在局限性,只有兩樣?xùn)|西是既便宜又無處不在的:語言和基因。通過語言學(xué)和遺傳學(xué)方法,我們可以往上追溯,探討東亞人群、語言、文明的起源和演化。從此,我們就展開了合作。
論文第一作者張夢翰是我的碩士和博士,他本科就讀于上海師范大學(xué)數(shù)學(xué)系,曾在中美大學(xué)生建模競賽中獲獎,有很高的數(shù)學(xué)才能。博士生階段我讓他去金力教授處和中科院上海生物研究所旁聽,借著這些機(jī)會,他熟練掌握了生物和遺傳方面的各種數(shù)學(xué)模型。而且他對相關(guān)文獻(xiàn)很熟悉,最近幾年,《自然》《科學(xué)》和《美國科學(xué)院院報(bào)》上連續(xù)發(fā)了好幾篇用貝葉斯方法來研究語言起源,解釋印歐語、南島語分化的論文,這給了張夢翰很大啟發(fā),他認(rèn)為漢藏語也可以使用這個(gè)方法來研究,于是才有了這個(gè)題目。
嚴(yán)實(shí)是復(fù)旦生命科學(xué)院的博士后,他主要負(fù)責(zé)處理材料。我們這個(gè)研究,光有合適的方法還不夠,還需要大量的材料,樣本越多,統(tǒng)計(jì)越精確,當(dāng)然,工作量相應(yīng)地也就大了。我們用了美國著名漢藏語專家馬提索夫(James A. Matisoff)教授的STEDT數(shù)據(jù)庫。馬提索夫用了三十年的時(shí)間建設(shè)這個(gè)數(shù)據(jù)庫,收錄了全世界漢藏語研究者認(rèn)定的同源詞,共有六百種語言。我們這篇論文選取了斯瓦迪士前一百個(gè)核心語義中的九十八個(gè),從馬提索夫的STEDT數(shù)據(jù)庫中選取了一百零九種語言。不算前期的材料處理,光是最后的運(yùn)算,在四核八線程的電腦上就連續(xù)運(yùn)行了四天,工作量的確很大。
事實(shí)上,我們本來打算和國際學(xué)者展開合作的。首先聯(lián)系的就是馬提索夫,經(jīng)得他的同意之后,使用了他的數(shù)據(jù)庫。
對這一百零九種漢藏語材料的處理,最后呈現(xiàn)出的成果是一棵譜系樹,這是怎么畫出來的?
漢藏語系中一百零九種語言的譜系樹
潘悟云:譜系樹是根據(jù)同源詞畫的,但是要辨認(rèn)同源詞是一件很麻煩的事情。例如,太陽這個(gè)詞,漢語最早是“日”,上古音讀njit,藏語的太陽是nima,ma是后綴,ni是詞根。上古漢語的nit與藏語的ni,一眼就能看出它們之間的同源關(guān)系。這是比較容易辨認(rèn)的同源詞。但是有的同源詞就很難辨認(rèn),比如數(shù)字“七”,漢語讀t?hi,羌族讀?in,景頗語讀?anit,彝語讀s?,這幾種語言之間的同源關(guān)系就需要我們深入、系統(tǒng)地加以比較,才能得出正確結(jié)論。如果僅憑看上去是否相似,來斷定不同語言之間是否存在同源關(guān)系,這顯然是不行的。
畫譜系樹采用的貝葉斯統(tǒng)計(jì)方法,不單是對計(jì)算年代有其長處,對畫譜系樹也有其特殊的長處。關(guān)于同源詞的比較,傳統(tǒng)的歷史比較方法只考慮數(shù)量,打個(gè)比方,語言A和B有二十個(gè)同源詞,A和C有十個(gè),二十個(gè)比十個(gè)多,可見A和B更有親緣關(guān)系。但是詞與詞的重要性是不一樣的,比如身體部位名稱就比人稱代詞重要,馬提索夫曾說過,身體部位名稱是核心詞中的核心詞。這很對,因?yàn)槿祟愓J(rèn)識世界總是從認(rèn)識自己開始。因此,身體部位名稱變化的速度比人稱代詞要慢。貝葉斯方法把語言變化速度納入考量,給每一個(gè)同源詞加權(quán),速度變化快的,次要一點(diǎn),變化慢的,重要一點(diǎn)。所以,我們現(xiàn)在是計(jì)算加權(quán)以后的同源詞。這樣畫出來的譜系樹,會更精確一些。
這次的研究成果對語言學(xué)有什么樣的意義和價(jià)值?能請您談?wù)剢幔?/p>
潘悟云:首先是對有關(guān)漢藏語系起源假說的證實(shí)。主要就是兩種假說,主流意見是“北方說”,認(rèn)為黃河中上游——也就是陜西甘肅寧夏一帶——是漢藏語系的起源地,馬提索夫,國內(nèi)的許多學(xué)者都持這種觀點(diǎn);另外一種“南方說”,以歐洲的范德利姆(George van Driem)教授為代表,認(rèn)為漢藏語系的起源地是中國西南到印度東北這一帶地區(qū)。這兩大派針鋒相對,其實(shí)都還是用傳統(tǒng)的歷史比較做出的猜想,誰都不能解決時(shí)間和地點(diǎn)的互動問題。我們的文章支持了“北方說”。
這次的研究成果,更有利于歷史語言學(xué)的發(fā)展。最早的語言是怎么樣的?年代一久,誰都說不清楚?,F(xiàn)在的學(xué)者就像盲人摸象一樣,有些人摸到鼻子,有些人摸到耳朵,有些人摸到尾巴,其實(shí)把各個(gè)方面的研究拼起來,才能還原古代語言的面貌。前面說過,我們目前采用的貝葉斯方法,能夠解決年代跟地點(diǎn)的問題,這兩點(diǎn)恰巧是歷史比較法的軟肋。但是貝葉斯方法不能解決語音構(gòu)擬問題,例如中古、上古漢語和原始藏語的讀音怎么樣,這是歷史比較法的強(qiáng)項(xiàng)。
把原始語言每一個(gè)階段怎么發(fā)音弄清楚,這有什么意義呢?它不只是解決古人怎么說話的問題,最終會使得整個(gè)歷史語言學(xué)的面貌煥然一新。十九世紀(jì),整個(gè)歐洲的語言學(xué)家都投身歷史語言學(xué)研究,到了二十世紀(jì)初,研究者漸漸減少。其中很大一個(gè)原因,就是傳統(tǒng)的歷史比較法存在一個(gè)很大的缺陷——不確定性,這與現(xiàn)代科學(xué)思潮是相抵觸的。歷史比較法無法做到定量化、形式化,因而逐漸退出語言學(xué)家的視野。大概是從上世紀(jì)六七十年代開始,美國的一些語言學(xué)家開始用新的方法去做歷史語言學(xué)研究。最核心的內(nèi)容是音變。這更符合現(xiàn)代科學(xué)的思路:人的語音為什么會變化?
人的語音變化。最重要受制于兩個(gè)因素:一個(gè)是發(fā)音器官,一個(gè)是聽覺器官。這兩種器官,古今中外是一樣的,所以由這兩個(gè)器官引起的音變現(xiàn)象,古今中外也是一樣的。于是,音變規(guī)律就有其普適性,就可以把演繹、推理的方法引入歷史語音研究。
現(xiàn)在大家都在研究,全世界的語言到底有哪些音變規(guī)律?其中最重要的就是自然音變(nature process),它是漸變的,而且可以從發(fā)音、感知上加以解釋。如果我們通過歷史語言學(xué)研究,把這些音變規(guī)律一條條研究出來,將來的歷史語言學(xué)就是另外一種面貌。確定了漢語與藏語、緬甸語是同一個(gè)祖先,即從同一種語言變化而來,就可以通過歷史比較,把這些語音的演變規(guī)則找出來。
另外,這次研究還有一個(gè)重大意義,有利于我們回答一個(gè)問題:中華五千年文明的根據(jù)是什么?甲骨文記載也只有三千多年。而我們通過研究漢藏語的起源、漢語和藏緬語的分化時(shí)間,可以確定漢語有五千九百年的歷史。這與中華文明探源工程定下來的五千八百年是相當(dāng)接近的。中華文明探源工程的依據(jù)是考古,我們的依據(jù)是語言比較,大家從各自獨(dú)立的研究,得出了接近的結(jié)論。
這個(gè)研究還要繼續(xù)推進(jìn)。漢語和藏緬語分化以后,漢語如何走向東南演化為各種漢語方言?藏緬語往西南怎么演化為藏語支和彝緬語支?彝緬語支又怎么分化為緬甸語和彝語?發(fā)生在什么時(shí)候,什么地點(diǎn)?整個(gè)中國版圖上這么多民族的來源和演變,都要弄清楚。
您覺得這次研究當(dāng)中體現(xiàn)出來的這種跨學(xué)科研究方法,對我們來說有什么啟發(fā)?
潘悟云:現(xiàn)在的語言學(xué)研究,有幾個(gè)學(xué)科要合在一起做。
一個(gè)是古文字研究。我是做上古音研究的,最近幾年我才意識到,古文字研究、考古發(fā)掘,對上古音研究的意義有多大。去年5月份北大文研論壇請我去做了一次講座,那次以后我就認(rèn)識了好多年輕的古文字學(xué)家。后來又到香港去開了一次會,又認(rèn)識了一批古文字學(xué)家。我覺得很欣慰,這批年輕的古文字學(xué)家可了不得,不僅懂古文字,而且懂上古音。
一個(gè)是前面提到的分子人類學(xué)。復(fù)旦有金力教授和他的科研團(tuán)隊(duì),將來肯定會形成一個(gè)古代人類學(xué)、古代語言學(xué)研究的國際學(xué)術(shù)中心。
另一個(gè)是民族語研究。我現(xiàn)在很關(guān)注民族語的搜集和整理。我?guī)ьI(lǐng)的團(tuán)隊(duì)經(jīng)常去少數(shù)民族地區(qū)進(jìn)行語言調(diào)查,這些搜集到的語言樣本,是很寶貴的進(jìn)行歷史語言比較的資料。