注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)新聞資訊文化

大學(xué)在“數(shù)字人文”中的角色和作用:重思理論與方法

按:本文為北京大學(xué)歷史學(xué)系教授朱青生2020年1月16日在北大“數(shù)字人文”建設(shè)研討會(huì)上的發(fā)言2020年1月12日,哲學(xué)系韓水法教授在德國(guó)中心做了關(guān)于人工智能時(shí)代的人文科學(xué)的報(bào)告。在這個(gè)報(bào)告中,他主張今

按:本文為北京大學(xué)歷史學(xué)系教授朱青生2020年1月16日在北大“數(shù)字人文”建設(shè)研討會(huì)上的發(fā)言

2020年1月12日,哲學(xué)系韓水法教授在德國(guó)中心做了關(guān)于人工智能時(shí)代的人文科學(xué)的報(bào)告。在這個(gè)報(bào)告中,他主張今天的人文科學(xué)要追問(wèn)以下三個(gè)問(wèn)題:

1.人是什么;

2.人的性質(zhì)在人工智能時(shí)代的變化(人工智能時(shí)代可以直接對(duì)應(yīng)“數(shù)字人文”中的“數(shù)字”所指);

3.變化前后的關(guān)系。

這三個(gè)問(wèn)題實(shí)際上也是大學(xué)在“數(shù)字人文”中所要遵循或必須重新思考的理論依據(jù),在理論思考的基礎(chǔ)上,才談得上如何使用的方法。當(dāng)然,在方法中有很多具體的技術(shù)性問(wèn)題。恰恰是在“數(shù)字人文”這個(gè)問(wèn)題上,是有了數(shù)字技術(shù)之后,即變化發(fā)生之后,才繼續(xù)來(lái)思考人文的問(wèn)題,但與人文精神似乎已經(jīng)相當(dāng)?shù)剡b遠(yuǎn),或者已經(jīng)非常地迫切,甚至 “數(shù)字人文”這個(gè)概念本身就是“人文”的悖論。按照韓水法老師的總結(jié),就是:“如下一種消極情緒漸漸的彌漫于人文主義的各派中:人不僅受到制度的壓迫和限制,還受到了自然科學(xué)和技術(shù)的壓迫和威脅。與此相應(yīng),如下一類傾向和態(tài)度在今天依然有不小的影響:反對(duì)進(jìn)步,保持傳統(tǒng)的風(fēng)俗習(xí)慣,甚至復(fù)辟古代社會(huì)的制度習(xí)俗以及迷信。”他還引用布洛克的說(shuō)法:“20世紀(jì)上半葉起人文主義所經(jīng)歷的主要沖突,乃是體現(xiàn)了人文主義的情感或非理性的因素與理性的沖突?!卑l(fā)展科學(xué)到底是為了人的全面發(fā)展還是為了消滅全面的人,把人都塑造成一個(gè)單面的科學(xué)人?這本身不就是進(jìn)入人工智能時(shí)代之后人文的問(wèn)題?人文的問(wèn)題就是人的問(wèn)題。

數(shù)字人文的各項(xiàng)工作都可以由各個(gè)方面的人來(lái)參與,數(shù)字技術(shù)和條件的發(fā)展基地正在發(fā)生漂移,一個(gè)機(jī)構(gòu)如Google或華為所能進(jìn)行的實(shí)驗(yàn)和生產(chǎn)不僅是在應(yīng)用層面,而且是在學(xué)科基礎(chǔ)層面。但是在大學(xué)里面到底怎么樣參與,大學(xué)應(yīng)該在其中起什么樣的作用,擔(dān)任什么樣的角色?本來(lái)中世紀(jì)大學(xué)并不是因?yàn)槔硇缘男枰?,而是出于神性的傳播而建立,但是現(xiàn)代大學(xué)早已是理性的保障和創(chuàng)造知識(shí)和傳播知識(shí)的堡壘。創(chuàng)造知識(shí)的前提是對(duì)于這個(gè)課題有充分的反思,今天是否應(yīng)該考慮,我們既要從數(shù)字人文發(fā)展的基本原理和根本要求出發(fā),也要從實(shí)踐的可能性上試驗(yàn)和謀求可行性方法。這里我想講我的三個(gè)意見(jiàn)。

筷子理論

第一是大學(xué)應(yīng)該創(chuàng)造性地制造和建立數(shù)字資源之間的“鏈接”——需要“筷子”。

在人文的意義上讓技術(shù)條件最大限度地方便和有效地解決人的問(wèn)題。對(duì)于全文數(shù)據(jù)庫(kù)的通用和稽查,大學(xué)所提供的任務(wù),主要是在通用性上制造之間的結(jié)合、聯(lián)合和通用索引,獲得信息的最方便、最合適的辦法。

北京大學(xué)曾經(jīng)在1996年做過(guò)一個(gè)古文獻(xiàn)全文數(shù)據(jù)庫(kù)嘗試。當(dāng)時(shí)由海德堡大學(xué)漢學(xué)系的瓦格納教授出資,由中文系古文獻(xiàn)研究所的孫欽善教授和我合作來(lái)負(fù)責(zé)學(xué)術(shù)。這個(gè)數(shù)據(jù)庫(kù)建成之后,當(dāng)然作為研究古文獻(xiàn)數(shù)據(jù)庫(kù)的角度,從中也探索了如何建造電子數(shù)據(jù)庫(kù)的一些校對(duì)??浫氲囊?guī)范和方法,其實(shí)我們更多看到的是這個(gè)工作并不適合大學(xué)研究人員來(lái)承擔(dān)完成的工作,而是應(yīng)該由一些專門(mén)的學(xué)術(shù)機(jī)構(gòu)、圖書(shū)館(含大學(xué)圖書(shū)館)或者是商業(yè)機(jī)構(gòu)來(lái)進(jìn)行操作。當(dāng)時(shí)有不少學(xué)校想要在中國(guó)做一系列數(shù)據(jù)庫(kù),提出要做《史記》的就有六、七家,完全沒(méi)有必要。因?yàn)榇藭r(shí)中國(guó)臺(tái)灣的“中央研究院”已經(jīng)做成了二十五史全文數(shù)據(jù)庫(kù),所用的底本是中華書(shū)局標(biāo)點(diǎn)本。海德堡大學(xué)漢學(xué)系還給大陸學(xué)者專門(mén)資助,可以在海德堡使用他們購(gòu)置版權(quán)的客戶端。所以我們已經(jīng)意識(shí)到世上將會(huì)有成千上萬(wàn)的數(shù)據(jù)庫(kù),事實(shí)上今天我們也看到,各個(gè)圖書(shū)館都有無(wú)數(shù)并不斷增加的古文獻(xiàn)數(shù)據(jù)庫(kù)和研究文獻(xiàn)全文數(shù)據(jù)庫(kù),甚至是古籍珍本開(kāi)放數(shù)據(jù)庫(kù)。當(dāng)時(shí)我們的想法就是應(yīng)該做一個(gè)可以用“一個(gè)方法,一條途徑”進(jìn)入所有數(shù)據(jù)庫(kù)的工具法,使得使用者可以非常方便地,而且符合邏輯地,符合最新知識(shí)圖譜作為背景地,去稽查所有的全文數(shù)據(jù)庫(kù),并對(duì)不斷增長(zhǎng)的數(shù)據(jù)庫(kù)保持開(kāi)放。所以我們向北京大學(xué)王義遒副校長(zhǎng)提出了申請(qǐng),組織相當(dāng)于今天的“數(shù)字人文”工作組來(lái)解決這個(gè)課題??上М?dāng)時(shí)北京大學(xué)還沒(méi)有把注意力移到這個(gè)方面。(現(xiàn)附1999年的一個(gè)發(fā)表記錄于后,附錄1)

今天這個(gè)問(wèn)題在世界的數(shù)字人文范圍內(nèi)并沒(méi)有全部解決,只是我們有了解決它的可能。如果我們北京大學(xué)圖書(shū)館能把已經(jīng)買下版權(quán)的數(shù)據(jù)資源提供給數(shù)字人文研究所來(lái)進(jìn)行這樣的實(shí)驗(yàn),未來(lái)就可能會(huì)把這個(gè)工具帶向所有的數(shù)據(jù)庫(kù),在一個(gè)統(tǒng)一的稽查系統(tǒng)中來(lái)建造更高層次上的應(yīng)用,雖然數(shù)據(jù)庫(kù)之間多有重復(fù),互有短長(zhǎng)。

在歐洲膳食中餐具多種,每吃一道菜就要用不同的刀叉,在德國(guó)甚至發(fā)明了針對(duì)不同的水果不同的刀具,獼猴桃和蘋(píng)果各不一樣,而中國(guó)人只用一雙筷子就可以吃所有的食物,這就是我們說(shuō)的“筷子理論”。

馬球理論

第二是大學(xué)應(yīng)該關(guān)注知識(shí)的全體,建造連接,擊破阻隔和區(qū)域保護(hù)——需要“馬球”。(即把司馬遷的“究天人之際,通古今之變”理念全球化)。

我們要用新技術(shù)來(lái)覆蓋和整合人類全部遺產(chǎn),打破壁壘,完成聯(lián)合。今天看到的所謂的密鑰技術(shù)、通訊保密主要來(lái)自于軍事上的發(fā)展和人類之間競(jìng)爭(zhēng)的需要,無(wú)疑這是過(guò)去和今天數(shù)字技術(shù)發(fā)展的主要?jiǎng)恿?,但也是人類自我殘殺和互相壓迫的潛在根?jù),是人類文明的保護(hù)與發(fā)展的巨大的阻礙。人類的和平絕不會(huì)因?yàn)槲覀兓ハ嘀g的保密而實(shí)現(xiàn),而是因?yàn)槲覀冎g的開(kāi)放、人類所有成員之間的共享而逐步成為可能。

所以在這種情況之下,我在國(guó)際藝術(shù)史學(xué)會(huì)推進(jìn)了這樣的一種工作,作為我在執(zhí)掌學(xué)會(huì)階段的四大任務(wù)之一,就是在區(qū)塊鏈(block chain)、5G和量子計(jì)算所提供的各種可能性上,建造互相之間的差異性的聯(lián)系,使得視覺(jué)與圖像可以在所有的人之間得到分享和共享。請(qǐng)見(jiàn)附錄中我做的元旦《國(guó)際藝術(shù)史學(xué)會(huì)2020新年賀詞》節(jié)選(附錄3)。

當(dāng)然我們希望人類和平,國(guó)家之間放棄競(jìng)爭(zhēng),保持合作,尋求人類的共同發(fā)展。但事實(shí)上,隨著人類科學(xué)和技術(shù)的高度發(fā)展,可以解決疾病的問(wèn)題,也可能解決饑荒的問(wèn)題,卻絕不可能解決戰(zhàn)爭(zhēng)問(wèn)題。人的榮譽(yù)總以超越平庸(常人)和折服他者(同行)作為存在的前提,人的尊嚴(yán)都是以抵抗超越和消滅優(yōu)先宣示奮斗的目標(biāo),羨妒交纏,生死相以,科學(xué)和技術(shù)的發(fā)展只會(huì)使人間的矛盾日益激烈,文化的競(jìng)爭(zhēng)更為慘烈,人對(duì)人的壓迫和侮辱愈發(fā)深入到骨髓和融入世代的血液之中,我們還沒(méi)有天真到相信勝利者會(huì)消除傲慢和偏見(jiàn),球隊(duì)的競(jìng)爭(zhēng)和情敵的仇視都會(huì)變成恨意,今天連小學(xué)生都要鼓勵(lì)排名和競(jìng)爭(zhēng),制造和販賣焦慮,怎么可能會(huì)因?yàn)榧夹g(shù)的進(jìn)步,財(cái)富的增長(zhǎng),內(nèi)心的自信與尊嚴(yán)的膨脹而減少和消除掉人與人之間的差異呢?我們已經(jīng)感覺(jué)到今天的國(guó)際形勢(shì)向我們展現(xiàn)出不容樂(lè)觀的現(xiàn)實(shí)和未來(lái),但是我們還是要不遺余力地去追求人的平等和人之間的溝通與共享。

天下先理論

第三是大學(xué)要做原創(chuàng)性的基礎(chǔ)工程,要在人類文明和最新技術(shù)的最前沿創(chuàng)造制度和方法,凡是別的機(jī)構(gòu)、學(xué)校已經(jīng)做過(guò)的,拿來(lái)使用即可,但是時(shí)刻不忘要做前瞻性、原創(chuàng)性的探索。

下面簡(jiǎn)單談?wù)剰?999年“網(wǎng)相語(yǔ)”的休眠到現(xiàn)在的“會(huì)生長(zhǎng)的學(xué)刊”——國(guó)際藝術(shù)史學(xué)會(huì)學(xué)刊E-journal版的重新再起。

1990年代我們?cè)诒贝髮?shí)驗(yàn)如何通過(guò)計(jì)算機(jī)把圖像與語(yǔ)言結(jié)合成一體在“視網(wǎng)膜和腦神經(jīng)之間的段落付諸傳播”。我們今天在利用超文本鏈接和各種新媒體時(shí),實(shí)際上只是把數(shù)字技術(shù)發(fā)生之前的人的自然“語(yǔ)言”做成了“電子版”。其實(shí)在舊石器時(shí)代結(jié)束前的很長(zhǎng)一段時(shí)間里,所有的人類交流主要是通過(guò)圖像來(lái)進(jìn)行。今天,圖像是圖像時(shí)代的基本數(shù)據(jù)和媒介,也是我的專業(yè)“藝術(shù)史”的前沿問(wèn)題。圖像除了我們熟悉的繪畫(huà)和交通標(biāo)志之外,除了大量的“新媒體”的模仿和敘事之外(此處的“新媒體”包括“舊新媒體”(照片)、“中新媒體”(電影)和“新新媒體”(計(jì)算機(jī)圖像)),還包含著觀看、攝制、描繪、圖解、符碼、文字和心像等7種不同的圖像,混在一起傳播。那么我們是否可以不按照現(xiàn)成的圖像和現(xiàn)成的語(yǔ)法來(lái)進(jìn)行交流,而是在它們還沒(méi)形成完整的圖畫(huà)(和文章)之前,就可以在網(wǎng)絡(luò)上通過(guò)數(shù)字技術(shù)訴諸交流?這樣的交流就是我們90年代在北大實(shí)驗(yàn)的“網(wǎng)相語(yǔ)”,也就是說(shuō),可以不用人腦的方式來(lái)規(guī)定機(jī)器,而是用機(jī)器的技術(shù)邏輯來(lái)重新定義人的交流和發(fā)展。這才是有了數(shù)字技術(shù)以后人與人之間的新的交流方法,也是數(shù)字人文的意義之所在。(請(qǐng)見(jiàn)附錄中2000年記錄思路的發(fā)表記錄,附錄2)

當(dāng)時(shí)我們把這個(gè)實(shí)驗(yàn)建議提交到了北大,也提交到了當(dāng)時(shí)的中信部,但是那時(shí)的中國(guó)還沒(méi)有今天這樣的條件和氣質(zhì),即超越發(fā)達(dá)國(guó)家,去探索直接針對(duì)和解決前沿問(wèn)題的可能性。而之所以我們會(huì)想到做這樣的事,是因?yàn)槲覀兊膶I(yè)是當(dāng)代藝術(shù)。當(dāng)代藝術(shù)有一種基本性格就是“原創(chuàng)”?!八械淖髌范急仨毷乔叭藳](méi)有做過(guò)的,也與同代的其他人不一樣的”,作品才有意義,否則這件當(dāng)代藝術(shù)作品不能成立。正是因?yàn)橛辛诉@樣的基本法則,我們才會(huì)不間斷地產(chǎn)生和追求各種實(shí)驗(yàn)的新思路。我們之所以推進(jìn)網(wǎng)相語(yǔ)的探索,是因?yàn)橹袊?guó)的文字(漢字)具有圖性,而中國(guó)的圖畫(huà)具有寫(xiě)(意)性,中國(guó)的藝術(shù)品具有文字和圖像共同并存所形成的圖與詞之間的間性,我們可以用此在腦神經(jīng)傳輸和圖像意義識(shí)別的問(wèn)題意識(shí)上來(lái)推進(jìn),對(duì)于圖像識(shí)別問(wèn)題,不是僅僅依賴深度學(xué)習(xí)的思路,而是使用對(duì)圖像的結(jié)構(gòu)和性質(zhì)的分析。但是被擱置了。

一晃20年過(guò)去了,被甩在了世界的后面的我們,又一次成了追趕者,但是追趕也不能一直跟隨,如果能夠突破,就要盡量往前,條件的艱難和基礎(chǔ)的薄弱并不能減少一個(gè)大學(xué)學(xué)者對(duì)世界的文明的義務(wù)和對(duì)學(xué)術(shù)的責(zé)任。我目前利用自己作為國(guó)際藝術(shù)史學(xué)會(huì)主席的權(quán)力再次推動(dòng)局部試驗(yàn)。在主持國(guó)際藝術(shù)史學(xué)會(huì)的學(xué)刊和官網(wǎng)時(shí),用了“E-journal——會(huì)生長(zhǎng)的學(xué)刊”概念,就是說(shuō)這個(gè)學(xué)刊的論文在發(fā)表的同時(shí),經(jīng)由全球聯(lián)網(wǎng)和人工智能圖像和文獻(xiàn)的搜索系統(tǒng),為之不間斷地增加修訂和補(bǔ)充的數(shù)據(jù)和結(jié)論。設(shè)想一下,當(dāng)你在20分鐘之后打開(kāi)自己發(fā)表的文章時(shí),你的文章已經(jīng)被修訂過(guò)了,這個(gè)修訂的過(guò)程所有人都可以參與(這個(gè)在許多科學(xué)刊物已經(jīng)做到),更多的是“數(shù)字人文”自動(dòng)進(jìn)行,每一點(diǎn)修改都有電子痕跡標(biāo)明個(gè)人的貢獻(xiàn)。在去年9月在佛羅倫薩舉行的國(guó)際藝術(shù)史學(xué)會(huì)的理事會(huì)上,我的這個(gè)提議還是被我們本行的同事否定了,他們認(rèn)為只能在年輕的學(xué)者中先行實(shí)驗(yàn)。當(dāng)然這個(gè)項(xiàng)目的意義與網(wǎng)相語(yǔ)不可比,但是可以在北大實(shí)驗(yàn)嗎?這是我的問(wèn)題,似乎這是大學(xué)在“數(shù)字人文”中的角色和作用不可替代之處的又一次呼吁。

當(dāng)然,我們要不停地來(lái)反思和建造人文。今天在大學(xué)里還在追問(wèn)人為什么需要人文這樣的東西,所以我們所有的事情只要發(fā)生問(wèn)題,終究還是為了人本身。我們今天受到了后人類的壓迫,不少思想者也把人文主義和人類中心主義放在一個(gè)可以批判的立場(chǎng)上,但是當(dāng)批判者已經(jīng)不存在的時(shí)候,所謂的人文主義和批判的可能性就等于沒(méi)有。如果今天要問(wèn)一個(gè)人文的根本問(wèn)題“人拋棄了所有,到底還剩什么?”,這個(gè)問(wèn)題本身就是一個(gè)悖論,在數(shù)字技術(shù)出現(xiàn)(1994年10月麻省理工學(xué)院計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室成立,建立者是蒂姆·伯納斯·李)之前,在萬(wàn)維網(wǎng)通用之前,這就是一個(gè)人文的悖論,就是說(shuō)如果我們拋棄了一切,誰(shuí)來(lái)拋?

如果我可以拋棄一切,那么還有一個(gè)“我”在,這個(gè)“我”就是人,就是人本身。


附錄1:1999年的全文數(shù)據(jù)庫(kù)通訊摘抄

古文獻(xiàn)數(shù)據(jù)庫(kù)必須齊全。

全,是指所有古文獻(xiàn)都包含在內(nèi),并可以用一種簡(jiǎn)便方法稽查。如果有部分古文文獻(xiàn)不包括在內(nèi),那么就會(huì)在“數(shù)據(jù)統(tǒng)計(jì)”中喪失其最根本的原則——全面考查。如果各種古文獻(xiàn)分屬于各個(gè)系統(tǒng),不能方便地統(tǒng)一檢索,全面考查就不可能進(jìn)行。不能讓每一個(gè)研究者操作使用,空有文獻(xiàn)庫(kù)而不能全面發(fā)揮作用,雖可讓少數(shù)人解決局部問(wèn)題,但不會(huì)使之成為中國(guó)人文科學(xué)的一個(gè)新臺(tái)級(jí)的基礎(chǔ)。況且,大家不能用,就不會(huì)有足夠理由和投入把古文獻(xiàn)全部做成數(shù)據(jù)庫(kù)。

齊,是指古文獻(xiàn)全文數(shù)據(jù)庫(kù)的質(zhì)量要整齊。質(zhì)量首先是原本的質(zhì)量,要選擇相對(duì)來(lái)說(shuō)??钡幂^好的本子作為底本,其他較好的諸種本子作為附錄本。數(shù)據(jù)庫(kù)相當(dāng)于資料庫(kù)的原始材料根據(jù)。制作數(shù)據(jù)庫(kù)不是進(jìn)行版本校勘,只要版本出處明確,就可使用。不必糾纏于版本間的正誤,留給專家在數(shù)據(jù)庫(kù)基礎(chǔ)上去處理版本的問(wèn)題。所以,數(shù)據(jù)庫(kù)的質(zhì)量主要是電子版本要與所錄版本完全一致。

其實(shí)齊全是不可能的,因?yàn)楣盼墨I(xiàn)留存至今的就是“烽火之遺葉”,損失不可計(jì)數(shù)。既使留存在世,也因人為原因,不可能一時(shí)盡收于庫(kù)。而且古文獻(xiàn)不斷被發(fā)現(xiàn),對(duì)已有古文獻(xiàn)的整理工作不斷貢獻(xiàn)著新的成果。但是要求齊全是一種觀念、一種信念,追求齊全,盡其力而不可得是一種天理,而不肯盡力,淺為輒止,投機(jī)取巧則是一種人欲。數(shù)據(jù)庫(kù)建設(shè)必“存天理、滅人欲”而后可。

至于不斷發(fā)現(xiàn)和出現(xiàn)的新的文獻(xiàn)和新的整理,只要了解數(shù)據(jù)庫(kù)的根本性質(zhì)就是開(kāi)放的,可以增補(bǔ)修改的,就不會(huì)成為問(wèn)題。一旦數(shù)據(jù)庫(kù)統(tǒng)一公布,必須配備專門(mén)機(jī)構(gòu)管理。過(guò)去太學(xué)的祭酒管理石經(jīng),大概派個(gè)監(jiān)生洗洗石碑,用墨拓一拓碑面,使人站在地上可以瞧見(jiàn)上半部分的字跡就夠了。今天主要工作是增補(bǔ)修正。

數(shù)據(jù)庫(kù)是國(guó)家大事,是中國(guó)國(guó)家形象的標(biāo)志,應(yīng)該由國(guó)家統(tǒng)一組織。古有熹平、正始石經(jīng)公諸天下,其現(xiàn)代形態(tài)正是今天的古文獻(xiàn)全文數(shù)據(jù)庫(kù)!不可能依靠民間或大學(xué)零打碎敲。中國(guó)大概有幾百個(gè)地方做數(shù)據(jù)庫(kù),低水平重復(fù),浪費(fèi)大,又增加了使用方式的繁雜和混亂,用的也多是國(guó)家的錢。即使是個(gè)人的精力和財(cái)富,也是天地之珍、人文之托、家國(guó)之有,容不得閑拋閑擲。有些商業(yè)機(jī)構(gòu)也想“以經(jīng)濟(jì)工作為中心”做數(shù)據(jù)庫(kù),結(jié)果是炒起來(lái)市場(chǎng),封殺了用戶。我作為北大的教授,每年的教學(xué)科研經(jīng)費(fèi)平均幾百元,學(xué)生又如何“買得起”數(shù)據(jù)庫(kù)。所以古文獻(xiàn)全文數(shù)據(jù)庫(kù)的商業(yè)化,正好是對(duì)中國(guó)人文科學(xué)研究的阻礙,少數(shù)占有原本和資金支配權(quán)的個(gè)人,可能會(huì)為了私利而延誤了中國(guó)國(guó)學(xué)的飛躍。

古文獻(xiàn)全文數(shù)據(jù)庫(kù)雖是中國(guó)國(guó)事,也是天下公事。境外除了臺(tái)、港之外,日本、韓國(guó)、美國(guó)、歐洲都有中國(guó)文化的研究,并動(dòng)用他們國(guó)家和基金會(huì)的經(jīng)費(fèi)制作中文古文獻(xiàn)全文數(shù)據(jù)庫(kù),其量和質(zhì)不在國(guó)內(nèi)水平之下。作為一個(gè)中國(guó)的學(xué)者,一方面欣慰,一方面慚愧:中國(guó)并非無(wú)人力財(cái)力,缺乏統(tǒng)一管理,但此而已。我曾想敦請(qǐng)學(xué)校主管校長(zhǎng)給國(guó)家主席和總理寫(xiě)一份“奏章”,后來(lái)轉(zhuǎn)念一想,肯定他們已經(jīng)知道此事(即使校長(zhǎng)不呈“奏章”)。做數(shù)據(jù)庫(kù)已是國(guó)內(nèi)“流行事件”,可能統(tǒng)一管理指日可待。

五六年以來(lái)具體地想方設(shè)法動(dòng)手做數(shù)據(jù)庫(kù),體會(huì)到目前關(guān)鍵在以下二點(diǎn):

1. 用“機(jī)械校對(duì)法”保證錄入文本質(zhì)量。

2.設(shè)計(jì)套用全世界所有全文數(shù)據(jù)庫(kù)的檢索軟件。

前年(1997年)學(xué)校召開(kāi)數(shù)據(jù)庫(kù)討論會(huì),樓宇烈老師說(shuō)“又想用,又不敢用數(shù)據(jù)庫(kù)”,所擔(dān)心的就是校對(duì)質(zhì)量。我們?cè)谧觥度珴h文》錄入工作時(shí),曾探索組織各種校對(duì)方式,收效很值得懷疑。我自己的專著,前后校對(duì)六七次還是有錯(cuò)。個(gè)人專著只不過(guò)涉及個(gè)人見(jiàn)解的表達(dá),而數(shù)據(jù)庫(kù)原則上不可有一點(diǎn)錯(cuò)誤,那是不是要校對(duì)100次呢?錄校數(shù)據(jù)以我們現(xiàn)行的方法,遺錯(cuò)不斷。經(jīng)過(guò)仔細(xì)考慮,應(yīng)該實(shí)驗(yàn)“機(jī)械法”。不用閱讀校對(duì),而要改造一個(gè)軟件,將所錄之文按被錄之文的文本格式、字體(大于90%相像)排印出,然后在透光的桌子上(相當(dāng)于照相館看底片者)機(jī)械核對(duì),錯(cuò)一個(gè)字,上下就對(duì)不上,馬上就能發(fā)現(xiàn)。這種核對(duì)無(wú)需文字、學(xué)術(shù)水平,只要系統(tǒng)精密,(理論上)最普通的打字員都可以錄100%準(zhǔn)確的數(shù)據(jù)庫(kù)。而遇有改字、斷句之類,則又有最高水平如孫欽善、裘錫圭這樣的老師來(lái)定奪,可一舉全改數(shù)據(jù)庫(kù)錄入的工作質(zhì)量。

在北大的討論會(huì)上,有一位計(jì)算機(jī)系的老師提出要做一個(gè)比臺(tái)灣《二十五史》更好的數(shù)據(jù)庫(kù)。我認(rèn)為數(shù)據(jù)庫(kù)既是天下公事,不比如體育比賽,如果想做一個(gè)好的,首先要使用已有的,看它差在哪里。臺(tái)灣《二十五史》使用的是目前最佳的中華書(shū)局原本,并投資幾億元,好幾個(gè)專家獻(xiàn)身于此十幾年如一日;而且全世界的使用者不斷為它反饋使用改進(jìn)意見(jiàn),他們定期增補(bǔ)修改,再為所有用戶更新。我一直在會(huì)上會(huì)下問(wèn):我們北大為什么不用?(現(xiàn)在中文系有一套可供內(nèi)部使用。)如果北大有心,可以通過(guò)購(gòu)買、交換、合作、索求,使用天下所有數(shù)據(jù)庫(kù),并大量補(bǔ)充天下所無(wú)文獻(xiàn)!針對(duì)各個(gè)數(shù)據(jù)庫(kù)檢索方法互異而且繁復(fù)的缺點(diǎn),設(shè)計(jì)套用軟件,使天下所有數(shù)據(jù)庫(kù)在北大可以統(tǒng)一使用,成為一個(gè)完整的數(shù)據(jù)庫(kù)。如果發(fā)現(xiàn)的確其中有有待重做者,請(qǐng)專家選擇善本,以機(jī)械校對(duì)法增補(bǔ)之。為國(guó)家數(shù)據(jù)庫(kù)的開(kāi)拓“兼并天下”,才不枉為中國(guó)第一大學(xué)。

但是,如果以為有了中文古文獻(xiàn)全文數(shù)據(jù)庫(kù),就一定能提高研究的質(zhì)量,那就大錯(cuò)而特錯(cuò)。有時(shí)我特別注意有些西方漢學(xué)家用數(shù)據(jù)庫(kù),找一些字義和詞式加以排列對(duì)比,統(tǒng)計(jì)核實(shí),經(jīng)常把一個(gè)字的不同的意義強(qiáng)聯(lián)在一起,又把同義而假借,訛變?yōu)椴煌淖诌z漏不計(jì),并持統(tǒng)計(jì)結(jié)果為確證,真不如不曾給他數(shù)據(jù)庫(kù)!否則他還可以反復(fù)玩味文意,不致簡(jiǎn)誕如此。數(shù)據(jù)庫(kù)對(duì)中國(guó)人文科學(xué)的最根本的質(zhì)量改變?cè)谟诮饷摿舜舭逵泦?wèn)之學(xué),凸顯出對(duì)于分析、求證和解釋的追求,使中國(guó)國(guó)學(xué)重在實(shí)驗(yàn)、驗(yàn)證、設(shè)計(jì)和研究,而不是老在數(shù)據(jù)記憶比賽中掩蓋對(duì)人性根本的追問(wèn)。

有了數(shù)據(jù)庫(kù),學(xué)人不是不要讀原文,而是更要通讀原文。利用數(shù)據(jù)庫(kù),一邊讀,一邊可以周密地反復(fù)溫習(xí)。楊樹(shù)達(dá)先生的以經(jīng)訓(xùn)經(jīng),人皆可達(dá),而且演化為讀書(shū)常法。沒(méi)有數(shù)據(jù)庫(kù)時(shí),常常記得少則無(wú)從復(fù)查,記得多則拖累創(chuàng)思。

有了數(shù)據(jù)庫(kù),文字學(xué)功夫就提到使用者面前,越能識(shí)得變體、異體、俗體、古今體,越能讀破假借字,就越會(huì)使用數(shù)據(jù)。音韻學(xué)功夫也提前,識(shí)得古音,深知省音、轉(zhuǎn)音、方音,就可以利用數(shù)據(jù)庫(kù)充分稽查檢閱文獻(xiàn)。

既如此,請(qǐng)時(shí)刻準(zhǔn)備著接受這個(gè)國(guó)學(xué)的飛躍!”

(《1999年的數(shù)字人文工作》,發(fā)表于《十九札》2000年版)


附錄2 :2000年發(fā)表的“網(wǎng)相語(yǔ)”概念

八)網(wǎng)相語(yǔ)

今天在北京大學(xué)我們?cè)谧鍪裁茨??現(xiàn)代書(shū)法從無(wú)錫實(shí)驗(yàn)到北大,現(xiàn)代又到達(dá)了一個(gè)新的時(shí)代。問(wèn)題改變了,人也改變了。彭俊軍已經(jīng)研究生畢業(yè),施杰已成為新一代現(xiàn)代藝術(shù)學(xué)會(huì)的會(huì)長(zhǎng)。

我們依舊在追問(wèn)書(shū)法的本質(zhì)到底是什么。書(shū)法不就是用一種語(yǔ)言形象性地傳達(dá)出人的信息嗎?

于是新的探索被稱作“網(wǎng)相語(yǔ)”,它是在計(jì)算機(jī)系統(tǒng)上尋找語(yǔ)言新的結(jié)構(gòu)、新的語(yǔ)法、新的概念。它要恢復(fù)語(yǔ)言在形成書(shū)面文字和口頭言說(shuō)之前的原思維狀態(tài),即一種在感受和思維狀態(tài)下的圖像和概念的綜合體。概念又同時(shí)呈現(xiàn)出不停分化、演進(jìn)和持續(xù)計(jì)算、自動(dòng)更新的過(guò)程。新的一代藝術(shù)家已經(jīng)在計(jì)算機(jī)網(wǎng)絡(luò)的新條件下開(kāi)始了現(xiàn)代書(shū)法的新實(shí)驗(yàn)。它不僅在中國(guó)是一個(gè)新的創(chuàng)舉,而且在世界的范圍內(nèi)可能改變網(wǎng)絡(luò)時(shí)代傳達(dá)的方法。它不再跟傳統(tǒng)書(shū)法有什么表面的聯(lián)系,而是要追問(wèn)一個(gè)根本的問(wèn)題:“書(shū)法如何成其為書(shū)法?”書(shū)法不再是一片紙片,也不再是一個(gè)人體、一個(gè)牌匾,當(dāng)然也不再成其為一個(gè)行為或一個(gè)觀念,而是一個(gè)項(xiàng)目、一個(gè)希望,因?yàn)樗休d著書(shū)法的根本境界——人的交流和傳播。(朱青生,《從無(wú)錫到北大——我所經(jīng)歷的現(xiàn)代書(shū)法試驗(yàn)》,載《現(xiàn)代書(shū)法》2000年第3-4期)

附錄3:國(guó)際藝術(shù)史學(xué)會(huì)的全球數(shù)據(jù)庫(kù)計(jì)劃

但是僅有這樣的聯(lián)系還不足以發(fā)揮藝術(shù)史的獨(dú)一無(wú)二的優(yōu)長(zhǎng)。在歷史上,我們把與自我形象和現(xiàn)象的不同視為珍稀的寶貝,把他人的寶藏當(dāng)成藝術(shù)的美感來(lái)欣賞,差異使我們互相觀照和傾慕。而現(xiàn)在,隨著圖像時(shí)代的到來(lái),圖像這個(gè)既與語(yǔ)言文字相異,又與考古的事物和遺跡并存的專門(mén)的行業(yè),突然在我們眼前平鋪出一道交流的坦途和奇景。也許我們還一直被另外一個(gè)希望鼓舞:在若干年前,國(guó)際藝術(shù)史學(xué)會(huì)理事會(huì)再度提出來(lái),希望用新技術(shù)來(lái)推進(jìn)一個(gè)全世界共建、共享的圖像數(shù)據(jù)庫(kù)。過(guò)去這對(duì)我們的前輩來(lái)說(shuō)是一個(gè)幻想抑或是妄想,但是現(xiàn)在區(qū)塊鏈的技術(shù),5G、6G的傳播能力和量子計(jì)算的新的通訊方法能讓圖像數(shù)據(jù)庫(kù)不再是一處的人做完以后再去互相分享,而是一處的人做而所有的相關(guān)者都能同時(shí)得到和擁有,這樣的新技術(shù)將會(huì)減少圖像因儲(chǔ)存和傳輸而產(chǎn)生的許多障礙,只要我們?cè)敢?,就能共有。在藝術(shù)史研究中,如果我們沒(méi)有對(duì)所有的圖像的充分全部的獲得與把握,可能我們所做的研究永遠(yuǎn)只是一個(gè)“個(gè)案”,而對(duì)于重要的問(wèn)題,如果沒(méi)有所有圖像間相互的關(guān)聯(lián),就無(wú)法進(jìn)行全面的判斷。每次讀到前輩和同事們寫(xiě)的書(shū),我都敬佩他們?yōu)榱艘恍┎牧虾托畔⒍逝烙诖竽又g,沉浸在古籍之中、孤燈之下,但總還感覺(jué)到他們的忐忑。由于地理、政治和意識(shí)形態(tài)的原因,還是有許多相關(guān)的圖像材料沒(méi)有被看到,還是有一些知識(shí)和常識(shí)沒(méi)有能夠被掌握。但是如果我們有了共同的聯(lián)系,有了一人做成同時(shí)就能讓所有的人分有的圖像數(shù)據(jù)庫(kù),合在一起,不久或者終有一天,就能在全部圖像數(shù)據(jù)的基礎(chǔ)上對(duì)某一個(gè)問(wèn)題進(jìn)行討論,解決一些重大的問(wèn)題才成為可能。(朱青生《國(guó)際藝術(shù)史學(xué)會(huì)2020新年賀詞》) 

熱門(mén)文章排行

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)