2021年11月26日,復(fù)旦大學(xué)中國近代史青年學(xué)者讀書班2021年第7期在線上進(jìn)行?;顒佑蓮?fù)旦大學(xué)歷史學(xué)系章可副教授召集主持,南京大學(xué)學(xué)衡研究院暨歷史學(xué)院邱偉云副教授受邀主講,講座題目為《概念史研究的數(shù)字轉(zhuǎn)向》。評議人為北京師范大學(xué)文學(xué)院方維規(guī)特聘教授。本文為主講人發(fā)言整理稿,末附評議人發(fā)言稿。
主講人邱偉云
主持人章可
過去十年的概念史研究法的數(shù)字轉(zhuǎn)向探索實(shí)踐,逐步證明了概念史研究法數(shù)字轉(zhuǎn)向的可能性,近年來也逐漸受到中國學(xué)界同行的肯定與關(guān)注。從全球概念史學(xué)界近年發(fā)展可見,自2015年開始已有海外名校同樣意識到將計(jì)算機(jī)學(xué)界的自然語言處理技術(shù)引入詞匯與概念研究中的可能性與發(fā)展前景。以下就從概念史研究的數(shù)字轉(zhuǎn)向?yàn)轭}來討論概念史研究方法數(shù)字轉(zhuǎn)向的可能發(fā)展與前景所在。
節(jié)點(diǎn)1:什么是概念史(history of concepts)?
由于參加我們今天這個討論會的師友們,有些是計(jì)算機(jī)學(xué)界的朋友,因此我先大概說明一下何謂概念史(history of concepts)。根據(jù)方維規(guī)老師研究指出,德文Begriffsgeschichte(概念史)一詞最早出現(xiàn)于黑格爾﹙Georg Wilhelm Friedrich Hegel﹐1770–1831﹚的《歷史哲學(xué)講座》中,指基于普遍觀念撰述歷史的方式,用來指稱一種史學(xué)類型,即考察藝術(shù)、法學(xué)和宗教的歷史,可以納入哲學(xué)史的范疇。而后在科塞雷克 (Reinhart Koselleck, 1923-2006)所主編的八卷本《歷史基本概念-德國政治和社會語言歷史辭典》(1972-1997)與《歷史語義學(xué)與概念史》(1979)書中,完成了“概念史”學(xué)派的定型。簡言之,概念史研究的目的,即希望通過考察重大概念在不同歷史語境中的社會影響,推導(dǎo)出政治社會群體運(yùn)用特定概念的典型張力,進(jìn)而分析時代、社會、政治的結(jié)構(gòu)變化,最后重構(gòu)社會史的截面,進(jìn)一步呈現(xiàn)出整個社會歷史,提供史學(xué)研究一個新范式。在概念史研究法特征上,我們發(fā)現(xiàn)了能與計(jì)算機(jī)學(xué)界文本探勘技術(shù)進(jìn)行協(xié)作研究的著力點(diǎn)所在,因?yàn)槲谋咎娇奔夹g(shù)正是一種可計(jì)算長時段中巨量文字語料里的詞語結(jié)構(gòu)及其變化的數(shù)字技術(shù),從這角度而言,文本探勘技術(shù)即能介入概念史研究視野,輔助概念史研究工作者進(jìn)行復(fù)雜與長時段的概念形成、運(yùn)用與嬗變研究。關(guān)于概念史研究法中豐厚且復(fù)雜的理論層次與研究視角,有興趣的師友可參見方老師自2019年出版的概念史三書,分別是《概念的歷史分量:近代中國思想的概念史研究》(北京:北京大學(xué)出版社,2019年)、《什么是概念史》(北京:生活·讀書·新知三聯(lián)書店,2020年)、《歷史的概念向量》(北京:生活·讀書·新知三聯(lián)書店,2021年),通過閱讀概念史三書,當(dāng)能較為全面的掌握德國概念史研究理論方法。至于概念史研究案例,可參見2013年開始至今,由南京大學(xué)學(xué)衡研究院院長孫江教授主編出版的《亞洲概念史研究》集刊,目前出版至第8卷,收錄眾多亞洲概念史研究的優(yōu)秀成果,當(dāng)然也不能錯過章可老師在概念史研究領(lǐng)域的力作《中國“人文主義”的概念史(1901-1932)》(上海:復(fù)旦大學(xué)出版社,2015年),章老師以一本書的分量系統(tǒng)且細(xì)密地揭示了“人文主義”的概念以及圍繞此概念的其他相關(guān)概念,是想了解概念史研究方法與實(shí)踐取徑的師友們不能錯過的好書。
《什么是概念史》
節(jié)點(diǎn)2:什么是數(shù)字轉(zhuǎn)向(Digital Turn)?
上面我們通過簡要的概述,幫助計(jì)算機(jī)學(xué)界師友們了解概念史研究方法的簡明基礎(chǔ)定義后,接著我們再談?wù)勈裁词菙?shù)字轉(zhuǎn)向(Digital Turn),以幫助人文學(xué)界師友們理解為何要數(shù)字轉(zhuǎn)向?以及如何數(shù)字轉(zhuǎn)向等問題。南京大學(xué)陳靜老師與香港城市大學(xué)徐力恒老師曾在〈我們?yōu)槭裁葱枰獢?shù)字人文〉(《社會科學(xué)報(bào)》第1572期,2017年8月24日,第5版)一文中指出,隨著數(shù)字技術(shù)更新迭代、數(shù)字化內(nèi)容不斷增加,數(shù)字化的研究趨勢得到了更廣泛的應(yīng)用,影響遍及各個人文學(xué)科。大約在2000年以后“數(shù)字轉(zhuǎn)向”(digital turn)時代到來,個人計(jì)算機(jī)變得十分普遍,成為大多數(shù)學(xué)者能方便使用的設(shè)備。如今通過高速高能的計(jì)算機(jī)設(shè)備,配合國家提出的數(shù)字中國主張,各界都如火如荼的對古代乃至近代的所有歷史文獻(xiàn)進(jìn)行數(shù)字化、數(shù)據(jù)化乃至智能化的工作,展開各種目前可見的大型數(shù)據(jù)庫建置項(xiàng)目計(jì)劃,運(yùn)用各種前沿的數(shù)字技術(shù),包括數(shù)據(jù)探勘、文本探勘、圖像標(biāo)記、網(wǎng)絡(luò)分析、時空地理分析、聲音分析技術(shù)等,對人文世界進(jìn)行諸多前沿性的探索性研究工作,這就是目前人文學(xué)研究的數(shù)字轉(zhuǎn)向情況。
節(jié)點(diǎn)3:概念史研究真的需要數(shù)字轉(zhuǎn)向嗎?
也許有師友們會問,概念史研究真的需要數(shù)字轉(zhuǎn)向嗎?在當(dāng)代語境中,我們不難想見未來乃是一切皆數(shù)據(jù)的世界。不僅過去的材料我們不斷的進(jìn)行數(shù)字化工作,諸如愛如生的“典?!敝泻迫鐭熀5臄?shù)字化古籍;或是近現(xiàn)代的史料數(shù)字化工作,如香港中文大學(xué)中國近代思想史專業(yè)數(shù)據(jù)庫(1830-1930)具有一億兩千萬字的全文史料內(nèi)容,晚清期刊全文數(shù)據(jù)庫(1833-1911)收錄期刊520余種,文章53萬余篇,民國時期期刊數(shù)據(jù)庫(1911-1949)收錄期刊25,000余種,文章1000余萬篇;中國社會科學(xué)院近代史研究所“抗日戰(zhàn)爭與近代中日關(guān)系文獻(xiàn)數(shù)據(jù)平臺”于2020年9月1日已上線報(bào)紙1046種、期刊2343種、圖書71071冊……以上數(shù)據(jù)平臺若配合前沿OCR技術(shù),在未來將轉(zhuǎn)為巨量可全文檢索與計(jì)算的文字文本。概念史研究者們未來在研究概念時,會有人力難以讀盡的材料。此外還須考慮到概念史研究的重點(diǎn)之一即做概念比較研究,目前東亞學(xué)界也不斷進(jìn)行歷史文獻(xiàn)材料數(shù)字化工作,如“韓國近代報(bào)刊語料庫”,近代中日詞匯交流有關(guān)文獻(xiàn)的數(shù)字檔案化與詞匯語料庫,及日本皓星社建置的《雜志記事檢索集成數(shù)據(jù)庫(1860-1945) 》(http://info.zassaku-plus.com/)等,都是未來在研究亞洲概念史時不可回避的巨量數(shù)據(jù)庫。目前歐美各國也都積極推行多語種歷史材料的數(shù)字化工程,如GALE平臺即收錄了跨越全球500 年歷史的1.7億頁珍稀原始資源文獻(xiàn),包含多種語言的文學(xué)、檔案、法律文書、手稿等內(nèi)容,其中ECCO 十八世紀(jì)作品在線數(shù)據(jù)庫更是收集了1700-1799年之間所有在英國出版的圖書和所有在美國和英聯(lián)邦出版的非英文書籍,涵蓋英語、法語、德語、西班牙語、拉丁文等多個語種,包含13萬種15萬卷,超過3,300萬頁的內(nèi)容。
因此,假如概念史研究就是要觀察詞語及其作為語言的運(yùn)用與嬗變過程,借以推導(dǎo)政治社會群體運(yùn)用特定概念的典型張力,分析時代、社會、政治的結(jié)構(gòu)變化,那么概念史研究就天然的適合與需要進(jìn)行數(shù)字轉(zhuǎn)向。由于數(shù)據(jù)化將使人類認(rèn)識世界的方式產(chǎn)生根本性轉(zhuǎn)變,因此未來世界不再是一連串自然或社會現(xiàn)象的事件,而是由信息所構(gòu)成(Viktor Mayer-Sch?nberger and Kenneth Cukier,2013),百年后的概念史研究者們?nèi)粝胍芯堪倌昵拔覀儸F(xiàn)在這個社會中的概念發(fā)展,他們會有看不完的文本,包含系統(tǒng)性的個人專著、論文,與碎片化的朋友圈、微博、推特等文字。這樣巨量的文字?jǐn)?shù)據(jù)信息,若不借助數(shù)字方法,將難以進(jìn)行“概念與社會”互動的概念史研究,因此現(xiàn)在的數(shù)字轉(zhuǎn)向正是在為未來的概念史家提出方法的準(zhǔn)備。
在上述全球歷史材料數(shù)字化工程下,可以想像未來概念史研究者的焦慮,將從過去的“動手動腳找材料”向“巨量材料如何讀盡”轉(zhuǎn)變。在舊文本不斷被數(shù)字化,新文本膨脹速度比舊資料快的語境下,未來概念史研究者必定面對材料過多無法讀盡的問題,這也是概念史研究的數(shù)字轉(zhuǎn)向的合理性與必要性所在。
節(jié)點(diǎn)4:全球概念史研究的數(shù)字轉(zhuǎn)向重要案例
正因全球歷史文獻(xiàn)材料如火如荼的數(shù)字化工作,使得全球概念史研究者們逐漸發(fā)現(xiàn),若不采用新工具與新方法,將出現(xiàn)難以窮盡所有歷史材料再進(jìn)行概念研究觀察與提出結(jié)論的問題,因此已有諸多著名大學(xué)研究團(tuán)隊(duì)開啟了概念史研究的數(shù)字轉(zhuǎn)向?qū)嵺`工作。
第一個案例是美國劍橋大學(xué)在2014-2018年設(shè)置的概念實(shí)驗(yàn)室(CCDK)。此一實(shí)驗(yàn)室嘗試通過計(jì)算方法描述和分析由概念結(jié)構(gòu)生成的結(jié)構(gòu)化環(huán)境,試圖揭示其中循環(huán)的概念網(wǎng)絡(luò)(https://ccdkconceptlab.wordpress.com/)。2020年,該團(tuán)隊(duì)的Peter de Bolla, Ewan Jones, Paul Nulty, Gabriel Recchia, John Regan共同發(fā)表了The Idea of Liberty, 1600 – 1800: A Distributional Concept Analysis, University of Pennsylvania Press in the Journal of the History of Ideas(Volume 81, Number 3, July 2020)一文,運(yùn)用計(jì)算和統(tǒng)計(jì)方法對十六到十八世紀(jì)的“Liberty”概念進(jìn)行分析,基于一套定制的分析概念結(jié)構(gòu)的工具,幫助對“Liberty”概念的文獻(xiàn)分析工作,并與以賽亞·伯林(Isaiah Berlin)和昆汀·斯金納(Quentin Skinner)過去有關(guān)Liberty概念的研究成果相互對話。
第二個案例是英國謝菲爾德大學(xué)數(shù)字人文學(xué)院(DHI),是英國領(lǐng)先的數(shù)字人文中心之一,成立于1994年。2016年春季開啟現(xiàn)代西方思語言DNA項(xiàng)目(https://www.dhi.ac.uk/ldna/),通過對十五到十八世紀(jì)英語話語中發(fā)生的語義和概念變化建模,進(jìn)以理解早期現(xiàn)代思想的演變。最近的研究成果可參見Digital methods for studying meaning in historical English. Special Issue of Transactions of the Philological Society, 119 (2)、§Susan Fitzmaurice, (2020).
第三個案例是新近成立的芬蘭赫爾辛基大學(xué)數(shù)字人文中心(HELDIG),這是一個集合赫爾辛基大學(xué)七個不同院系數(shù)字人文學(xué)科相關(guān)領(lǐng)域的協(xié)作中心。早在成立之初的2015年,他們就舉辦了“概念變化–數(shù)字人文案例研究座談會”,討論應(yīng)該如何使用大的數(shù)字化歷史數(shù)據(jù)研究概念變化。自2017年起,這個中心開始連年舉辦“概念計(jì)算方法”專題討論會、“歷時性概念變化的計(jì)算方法”討論會、“言語與行動:政治文本挖掘” 講習(xí)班及詞匯語義變化講習(xí)班等,密切聚焦于計(jì)算概念研究的趨勢方法及其轉(zhuǎn)向。
節(jié)點(diǎn)5:中國概念史研究的數(shù)字轉(zhuǎn)向
對詞匯概念的“形成”“運(yùn)用”與“變化”研究視角進(jìn)行量化轉(zhuǎn)譯與考察,很早就已經(jīng)在中國學(xué)界出現(xiàn)?;诖藢υ~匯概念研究進(jìn)行數(shù)字轉(zhuǎn)向的思考,配合計(jì)算機(jī)學(xué)界自然語言處理技術(shù)的迭代與更新,在中國概念史研究學(xué)界中產(chǎn)生了三種領(lǐng)先全球的新的量化考察視角。
第一種是結(jié)合文本探勘技術(shù)與網(wǎng)絡(luò)分析技術(shù)對概念關(guān)系進(jìn)行量化計(jì)算并發(fā)現(xiàn)互斥概念的研究路徑。如我與鄭文惠、劉昭麟、林書佑等老師合作的《概念關(guān)系的數(shù)位人文研究——以<新青年>中的“世界”觀念為考察核心》(收于項(xiàng)潔主編:《數(shù)位人文:在過去、現(xiàn)在和未來之間》(臺北:臺灣大學(xué)出版中心,2016年12月)一文,以數(shù)字人文技術(shù)與德國概念史理論對話,勾勒《新青年》500萬字語料中與“世界”概念共現(xiàn)的概念群并計(jì)算其間的概念網(wǎng)絡(luò)。該文使用機(jī)率統(tǒng)計(jì)、統(tǒng)計(jì)學(xué)中的LSA、PMI等關(guān)系性計(jì)算,以及詞匯相依計(jì)算法等多種可能適用于概念關(guān)聯(lián)性計(jì)算的方法,發(fā)現(xiàn)《新青年》前后不同時段“世界”概念共現(xiàn)詞群的分合。其中“世界”與“天下”這一對概念呈現(xiàn)出從不顯著相關(guān)到顯著負(fù)相關(guān)的變化,表示“天下”概念與世界論述互斥,此種概念關(guān)系型態(tài)是人力不能考察者,亦即是數(shù)字人文視野下獨(dú)特的發(fā)現(xiàn)。
第二種是對漢語詞綴復(fù)合詞研究進(jìn)行量化計(jì)算的工作。關(guān)于漢語詞綴復(fù)合詞研究工作,2001年方維規(guī)老師即發(fā)表 “Yi,Yang,Xi,Wai and Other Terms:The Transition from ‘Barbarian’to ‘Foreigner’in Late Imperial Chi- na”(“夷”、“洋”、“西”、“外”及其相關(guān)概念:晚清譯詞從“夷狄”到“外國人”的轉(zhuǎn)換in:New Terms for New Ideas:Western Knowledge & Lexical Change in Late Imperial China,ed.by Michael Lackner et al.,Leiden:Bril l,2001)一文,探討由“夷”“洋”“西”“外”等四個漢語詞綴所復(fù)合出的四批復(fù)合詞間的時代變化,從中提出中國近代對西方認(rèn)同的轉(zhuǎn)型現(xiàn)象;而后2011年章清先生發(fā)表《“界”的虛與實(shí):略論漢語新詞與晚清社會的演進(jìn)》(《東アジア文化交渉研究》,別冊7,2011 年3 月)一文,更是直接指明漢語詞綴復(fù)合詞研究的意義與價值,文中指出作為現(xiàn)代漢語中頗為特殊的“后綴復(fù)合詞”(或稱為“接尾詞”),這樣的構(gòu)詞法已預(yù)示其具有明顯的開放性和不確定性,往往成為考察語言成長具有特殊意義的例證,而這樣的構(gòu)成法大大提升了語匯的制造能力,“后綴”之前添加什么,決定于中國社會所做的取舍。拙作《詞匯、概念、話語:數(shù)字人文視野下中國近代“美”之觀念的建構(gòu)與再現(xiàn)》(收入周憲主編:《藝術(shù)理論與藝術(shù)史學(xué)》第三輯(北京:中國社會科學(xué)出版社,2019年10月)即實(shí)踐了漢語詞綴復(fù)合詞研究法的量化轉(zhuǎn)譯工作,通過數(shù)字人文技術(shù),計(jì)算并歸結(jié)中國近代“美”之觀念的建構(gòu)與再現(xiàn)軌跡,有一從“美善”“美術(shù)”到“美育”的三階段發(fā)展過程,并發(fā)現(xiàn)中國近代“美”之觀念具有教化性與實(shí)用性兩個特征。當(dāng)我們能將此前所提到的中國從古代到近當(dāng)代所有建置完成的數(shù)據(jù)庫加以串連,那么我們就可望通過數(shù)字技術(shù),勾勒出中國各種詞匯概念由傳統(tǒng)至當(dāng)代的發(fā)展史,這是過去依靠人力難以完成的重大工作。
第三種是結(jié)合圖像標(biāo)記技術(shù)對圖像概念史進(jìn)行量化計(jì)算工作。如王平、鈕亮、金觀濤、劉青峰等發(fā)表的《五代北宋山水畫的數(shù)位人文研究(二)——以“漁隱”主題為例》(收入《數(shù)位典藏與數(shù)位人文》2018年第1期 )一文,即以五代北宋時期至今流傳的120余幅山水畫圖像為研究對象,圍繞舟船、漁人兩類圖像進(jìn)行數(shù)據(jù)擷取與圖像分析,以此去追溯“漁隱”主題及其概念的原形與流變。在圖像概念史研究法的數(shù)字轉(zhuǎn)向思考中,研究者嘗試通過計(jì)算機(jī)自動發(fā)現(xiàn)穩(wěn)定圖像形式結(jié)構(gòu),使人文研究者可考察其圖像概念含義,以及從穩(wěn)定圖像形式結(jié)構(gòu)去考察其圖像概念譬喻含義,或從概念寓意畫考察其圖像概念含義。當(dāng)圖像數(shù)據(jù)的收集與數(shù)字化、數(shù)據(jù)化乃至于智能化工作完成,概念史研究者們即可快速地從長時段的跨國圖像中發(fā)現(xiàn)概念環(huán)流的蹤影與歷史意義。
節(jié)點(diǎn)6:中國概念史研究數(shù)字轉(zhuǎn)向的未來方向
以上我們已經(jīng)介紹了全球概念史研究在數(shù)字轉(zhuǎn)向上的經(jīng)典項(xiàng)目以及中國在概念史研究法數(shù)字轉(zhuǎn)向上的獨(dú)特貢獻(xiàn),下面可再從人文的概念史理論視角出發(fā),談?wù)勚袊拍钍费芯繑?shù)字轉(zhuǎn)向的未來方向。
第一個基于中國概念史理論可以進(jìn)行數(shù)字轉(zhuǎn)向的工作是中國近代概念發(fā)展轉(zhuǎn)型的數(shù)字考察。孫江教授曾在《概念史研究的中國轉(zhuǎn)向》(《學(xué)術(shù)月刊》2018年第10期)一文中討論中國近代概念轉(zhuǎn)型的問題,基于中國近代概念轉(zhuǎn)型的特征,提出了有別于德國概念史家科塞雷克所勾勒出的德國近代鞍型期概念轉(zhuǎn)型中的“四化”尺度,分別是標(biāo)準(zhǔn)化(Standardization)、大眾化(Popularization)、政治化(Politicization)、衍生化(Derivatization),未來可進(jìn)一步通過文本探勘的量化模型方法,轉(zhuǎn)譯與偵測中國近代概念轉(zhuǎn)型中的概念四化發(fā)展現(xiàn)象。
第二是基于中國近代漢字發(fā)展的詞化現(xiàn)象進(jìn)行數(shù)字轉(zhuǎn)向研究。如日本關(guān)西大學(xué)沈國威教授在《近代中日詞匯交流研究:漢字新詞的創(chuàng)制、容受與共享》(北京:中華書局,2010)一書中指出,詞化是對概念的命名。概念可以用一句話、一個說明性或比喻性詞組、一個短語來表達(dá),而當(dāng)概念用一個詞來指稱時,叫做概念的“詞化”,或稱“詞匯化”。通過數(shù)字轉(zhuǎn)向,可以利用詞嵌入、文本探勘、時空地理、網(wǎng)絡(luò)分析等技術(shù)進(jìn)一步的量化轉(zhuǎn)譯東亞近代概念詞匯化的進(jìn)程。
《近代中日詞匯交流研究:漢字新詞的創(chuàng)制、容受與共享》
第三是基于近代中日韓三國之間概念環(huán)流現(xiàn)象進(jìn)行數(shù)字轉(zhuǎn)向研究。亦即可運(yùn)用時空地理技術(shù)、文本探勘、網(wǎng)絡(luò)分析方法等,結(jié)合中日韓三國對于同一概念的研究數(shù)據(jù)基礎(chǔ),進(jìn)行跨國的概念數(shù)據(jù)比較研究,借以揭示概念的源流以及在長時段過程中三向影響交流的動態(tài)過程。
今日所談的概念史研究的數(shù)字轉(zhuǎn)向方法與趨勢,正符合文理交叉的“新文科”主張,這一主張使得我們一方面能通過結(jié)合計(jì)算機(jī)與統(tǒng)計(jì)方法對人文研究議題進(jìn)行“人文數(shù)字化”的思考與探討,另一方面又能再基于人文關(guān)懷角度去商榷與研發(fā)帶有人文性的計(jì)算統(tǒng)計(jì)方法而完成“數(shù)字人文化”工作。唯有建立起人文數(shù)字化與數(shù)字人文化兩個角度的循環(huán)交流協(xié)作工作流程,才能真正落實(shí)新文科的文理交叉訴求,為2035年建成高等教育強(qiáng)國、實(shí)現(xiàn)中國教育現(xiàn)代化提供有力支撐。
評議人發(fā)言:方維規(guī)教授
問題一:
用計(jì)算機(jī)進(jìn)行人文研究易缺乏人文溫度:計(jì)量研究如遠(yuǎn)讀認(rèn)為重要的關(guān)鍵點(diǎn)在數(shù)值的高峰,但人文研究學(xué)者會認(rèn)為概念的意義在走勢之中,因?yàn)楦拍铐敺逡呀?jīng)喪失了銳氣,但人文研究者更在乎的是發(fā)展趨勢中如何普及的過程,以及普及過程中報(bào)人或是百姓等不同層次行動者的理解現(xiàn)象,但這些研究角度在計(jì)算機(jī)視角中容易被忽略。且在數(shù)字轉(zhuǎn)向之中,很多研究結(jié)果都以可視化圖表方式進(jìn)行呈現(xiàn),但這種數(shù)據(jù)可視化的結(jié)果易將“人”推向平面化,亦即只關(guān)注高低而不關(guān)注過程,會削弱其中豐富的人文性信息。
回答:對于這一問題,數(shù)字人文學(xué)界也開始進(jìn)行反思,亦即數(shù)字轉(zhuǎn)向的發(fā)展,并非拿來主義式的只聽從于計(jì)算方法的“人文數(shù)字化”,也許在過去十年我們確實(shí)是走“人文數(shù)字化”的道路,因?yàn)槟菚r是在探索階段,我們得先把各種計(jì)算方法拿來探索實(shí)踐,看看是否能結(jié)合?然而在十年后的今天,數(shù)字轉(zhuǎn)向應(yīng)該邁向建立理論的方向,亦即我常說的轉(zhuǎn)向“數(shù)字人文化”的方向,我們不能再像過去十年一樣,不問計(jì)算方法的優(yōu)劣以及其是否合適拿來計(jì)算人文問題,只要看到最新方法就拿來使用,只求量化視角的信校度,卻不問這些新方法是否適合用于計(jì)算人文問題。如今我們應(yīng)該邁向從人文角度去對各種最新的方法進(jìn)行“人文性”的信校度提問與反思階段,亦即必須通過人文視野去判斷與反思各種最新計(jì)算方法的人文研究配適性,甚至是更進(jìn)一步,應(yīng)當(dāng)基于人文問題意識的需求,量身定做計(jì)算方法,如此一來,像方老師提出人文學(xué)者更應(yīng)關(guān)注的是概念的爬坡發(fā)展階段的重要性此一研究視角,就能通過量身定做,發(fā)展出一種探索概念爬坡軌跡與信息的測量方法,以符合人文研究者的需求。這樣的方法才是真正結(jié)合數(shù)字與人文的思考后所產(chǎn)生出的真正的數(shù)字人文方法。
問題二:
在概念研究中常見存在著一種概念用多種不同詞匯來翻譯與理解的現(xiàn)象,例如Democracy在近代就有“民主”與“共和”兩種譯法,那么在利用數(shù)字方法進(jìn)行Democracy概念研究時,如果只注意到“民主”或“共和”,就是忽略了其他當(dāng)時同時代表著Democracy概念的發(fā)展向度,基于這樣的問題,數(shù)字人文方法如何解決?
回答:目前在自然語言處理技術(shù)當(dāng)中,有種非監(jiān)督學(xué)習(xí)的詞向量研究法,可以通過詞匯的上下文語義關(guān)系,偵測并辨別出長時段巨量文本中的近義詞,有望處理并解決一詞多義與多詞一義的問題。因此對于上述問題,未來可以利用詞向量方法進(jìn)行探索性實(shí)驗(yàn),通過數(shù)據(jù)驅(qū)動的方法找到并解決同一概念具有多種詞匯能指的問題。
問題三:
報(bào)告中談到全球概念史的比較問題,在這中間有很多需要考慮的地方,例如中日概念對比時候,要注意概念先后問題;還有概念到底是在殖民地或是半殖民地發(fā)展也會有所不同,而這些細(xì)節(jié)往往并非量化方法所考慮的問題?該如何解決?而且概念在跨語境間是很難進(jìn)行比較的,因?yàn)楦拍铍S著語境不同有著完全不同的變化?那么全球概念比較研究如何可能?
章可老師回應(yīng)
我認(rèn)為全球概念史研究還是有可能的,因?yàn)榧词垢拍顣S著語境而有很大的不同,但跨語境中還是有屬于非語境成分,這個非語境成分恰恰是語義帶來的,而這往往就是全球概念史的基礎(chǔ),因此全球概念比較研究還是有可能的。
回答:這正是概念史研究法在數(shù)字轉(zhuǎn)向過程中需要通過人文與計(jì)算機(jī)領(lǐng)域?qū)W者密切討論去解決的問題。概念史學(xué)者可以提出各種在研究概念時應(yīng)當(dāng)關(guān)注的人文研究變項(xiàng),而計(jì)算機(jī)學(xué)者就能從這些變項(xiàng)去思考該如何通過計(jì)算權(quán)重的調(diào)整與方法的復(fù)合重組,讓計(jì)算方法能很好的回應(yīng)人文學(xué)者所關(guān)注的焦點(diǎn)問題,因此概念史研究的數(shù)字轉(zhuǎn)向,需要人文學(xué)者多多提出人文性的關(guān)懷視角,借以發(fā)展適合于概念史研究專用的數(shù)字計(jì)算方法。而章可老師提出可以考察跨語境當(dāng)中的非語境成分的問題意識,即是未來在概念史研究數(shù)字轉(zhuǎn)向中可以通過量化模型去嘗試加以勾勒的重要人文問題。
問題四:
從莫來蒂提出世界文學(xué)的研究主張中,可以發(fā)現(xiàn)世界文學(xué)的研究可能帶有偏見,這里的偏見包括世界文學(xué)的組成多為英語文學(xué),而其他語種則少;又或者殖民文學(xué)多,精英文學(xué)多,那么這樣的研究結(jié)果可以稱為世界文學(xué)嗎?
回答:確實(shí),老師提出的是目前數(shù)字轉(zhuǎn)向中時常被提出來進(jìn)行反思的一個問題,亦即“數(shù)據(jù)偏見”。例如斯坦福大學(xué)李飛飛教授他們曾經(jīng)對大量圖片進(jìn)行人機(jī)互動標(biāo)記工作,進(jìn)而訓(xùn)練出一個能自動標(biāo)記圖片的模型,當(dāng)他們將穿有白紗的女性圖片給予識別時可以自動識別出是婚禮;但當(dāng)他們將印度女性穿著印度傳統(tǒng)婚紗的圖片給機(jī)器識別時卻識別出是戲劇,這里問題就出在訓(xùn)練計(jì)算機(jī)自動辨識模型時所用的圖像多為西方圖片,因此只能較好的識別西方圖像中的事物,但對東方事物的識別就產(chǎn)生了問題,這就是一種“數(shù)據(jù)偏見”,亦即機(jī)器所學(xué)習(xí)的數(shù)據(jù)是有偏向的,如此所建置的計(jì)算識別模型語自然也是帶有偏向的。在此案例中,李飛飛即通過調(diào)整機(jī)器學(xué)習(xí)的數(shù)據(jù),更為多元的重新收集機(jī)器學(xué)習(xí)的圖像材料,借以讓機(jī)器學(xué)習(xí)的結(jié)果更為公正客觀而不具有偏見。就此而言,概念史研究的數(shù)字轉(zhuǎn)向前提,就是我們用以計(jì)算概念發(fā)展的語料必須盡量避免材料的傾斜,對語料結(jié)構(gòu)必須十分了解,如此才能針對語料結(jié)構(gòu)的傾斜而調(diào)整計(jì)算權(quán)重,進(jìn)一步避免與解決數(shù)據(jù)偏見可能導(dǎo)致偏見結(jié)論的問題。