如今,以ChatGPT為代表的AI(Artificial Intelligence,人工智能)大語言模型正在深刻影響人類生活的方方面面。傳媒、醫(yī)療、法律乃至搜索引擎等行業(yè),隨著AIGC(Artificial Intelligence Generate Content,人工智能生成內(nèi)容)時代的到來,已經(jīng)開始面臨重大的變革與挑戰(zhàn)。以醫(yī)療行業(yè)為例,醫(yī)生可通過特定的AI模型和算法,大量采集、分析患者病灶信息,從而提高診療精度與效率。
那么,致力于收集、分析各類史料,并以一定“技藝”創(chuàng)作學術(shù)作品的歷史學家們,面對AIGC的挑戰(zhàn)是否能夠“獨善其身”?AIGC時代的來臨究竟會對傳統(tǒng)史學研究造成怎樣的影響?歷史學家如何更理性地認識AIGC時代的種種技術(shù)變革?上述問題均值得當下每位治史者深思。
與會學者合影
為此,2023年6月10日,上海市高水平地方高?!皵?shù)字人文資源建設(shè)與研究”重點創(chuàng)新團隊、上海師范大學都市文化研究中心、上海師范大學數(shù)字人文研究中心、上海師范大學人文學院以及上海師范大學光啟國際學者中心聯(lián)合主辦的“AIGC時代的歷史學家:角色、使命與責任”學術(shù)研討會,在上海師范大學光啟國際學者中心舉行。本次研討會共有來自全國多地的21位專家學者參會。與會專家學者分別就大語言模型的運用及其局限、數(shù)字化風潮對傳統(tǒng)史學的挑戰(zhàn)以及數(shù)字資源與工具的運用等專題展開了熱烈討論。
開幕式由上海師范大學人文學院蔣杰副教授主持。上海師范大學都市文化研究中心主任蘇智良教授及上海師范大學人文學院副院長張劍光教授分別致辭。蘇智良教授表示,關(guān)注新技術(shù)及其對史學研究的影響,并非年輕學人的專利。事實上,王家范、鄧小南等前輩學者曾先后撰文對人工智能等新技術(shù)如何改變史學研究進行過思考?,F(xiàn)代的歷史學者,應(yīng)具備思考如何善用新技術(shù)以及技術(shù)變革如何引領(lǐng)人類文明進步的自覺。張劍光教授則以自身研究經(jīng)歷為例,勉勵與會專家學者,特別是年輕學人要積極擁抱新技術(shù),善用新工具輔助研究。此外,他還談到了一些史學界的熱點問題,指出大語言模型等新工具的使用,可能拓展研究者的觀察視野,并為解決爭論積久的史學公案提供可能。
AIGC對既有史學研究的影響
來自上海圖書館的夏翠娟研究員從人文研究的數(shù)字方法、數(shù)字人文方法論形成與嬗變、AIGC與數(shù)字人文研究范式的轉(zhuǎn)變、后數(shù)字時代需要怎樣的人文研究、歷史學研究在AIGC時代面臨的困境這五個方面展開討論,作了題為“理解歷史學研究的數(shù)字方法以及在AIGC時代轉(zhuǎn)向的可能”的報告。她指出,近10年來興起的基于大數(shù)據(jù)技術(shù)的數(shù)字史學將計算思維引入史學研究中,更需要傳統(tǒng)史學研究中運用的批判思維。這是由于史料數(shù)據(jù)化過程本身是一種建模和抽象的過程,基于大模型的AIGC,不僅如此,還會在建模和抽象的過程中生成根本不存在的內(nèi)容。數(shù)據(jù)和模型帶給研究者的觀察視角,既可能是“顯微鏡”或“望遠鏡”,也可能是對真實世界產(chǎn)生形變的“哈哈鏡”。若將數(shù)據(jù)、算法和模型作為數(shù)智證據(jù),須與傳統(tǒng)文獻史料等進行多重證據(jù)交叉驗證,并在數(shù)據(jù)化和模型化的整個過程中運用批判思維。歷史學是一個以“求真”為主要目的的學科,在AIGC時代,歷史學面臨的一個重要困境,可能是在一個虛實融生的數(shù)字世界中,如何處理AIGC的“內(nèi)容虛構(gòu)而算法真實”問題。
上海外國語大學圖書館歐陽劍研究員則從人文社科領(lǐng)域研究的三個要素:數(shù)據(jù)資料、研究方法與知識生產(chǎn)出發(fā),探討類ChatGPT的AI語言模型對人文社科研究的影響。他指出,從數(shù)據(jù)資料來看,由于ChatGPT接受的語料庫主要為部分網(wǎng)絡(luò)文本、圖書和文學作品、社交數(shù)據(jù)等。因此,就數(shù)據(jù)的廣泛性與真實性而言,從人文社科所需的數(shù)據(jù)資料來說,ChatGPT的語料本身有疑問;在研究方法與知識生產(chǎn)上,歐陽劍指出由于ChatGPT生產(chǎn)的知識是基于信息論“概率”基礎(chǔ)上的自然語言處理產(chǎn)生,與人類基于意向性邏輯生成的知識有本質(zhì)差異,故目前ChatGPT產(chǎn)生的知識是缺乏反思性的“初級形態(tài)知識”。
上海師范大學蔣杰副教授從“概念”、“影響”與“應(yīng)對”等三個維度,討論了AIGC對歷史學的影響。他指出,由于目前的大語言模型是基于機器學習、文本挖掘和自然語言處理等技術(shù),利用公開的互聯(lián)網(wǎng)數(shù)據(jù)訓練而成。因此,它在一定程度上掌握了人類語言的知識與規(guī)律,如語法概念、上下文關(guān)系等,并可以此為基礎(chǔ)展開各類分析,大大拓展了AI工具的通用性和適用場景。在現(xiàn)階段,大語言模型已經(jīng)能理解人類語言,但從目前已經(jīng)公開的各種大語言模型來看,尚無法理解語言背后的思想,因此可能還不具備真正的創(chuàng)新性和創(chuàng)造力。在影響和應(yīng)對層面,他指出,從積極的角度觀之,大語言模型工具對歷史學者翻譯外語文獻、開展數(shù)據(jù)清洗等機械性工作大有裨益;但也容易讓使用者,尤其是青年學生產(chǎn)生依賴,削弱他們的創(chuàng)造性思維。加之語料庫信息品質(zhì)的爭議,容易陷入算法偏見與虛假信息之窠臼。
上海音像資料館虞偉紅老師進行了題為“從媒介考古學看AIGC時代”的報告。她援引弗里德里?!せ乩眨‵riedrich A.Kittler)等學者運用的“媒介考古”研究路徑,提出媒介的物質(zhì)性對人的影響和改造,延伸到如今跨模態(tài)AI大模型等新工具的廣泛應(yīng)用會對人的思想乃至主體性產(chǎn)生影響的可能性:有如哲學家尼采在眼盲后運用打字機生產(chǎn)的作品,在思想表達等方面有了實證的變化,尼采也承認書寫設(shè)備參與了人思想的形成。因此,回顧媒介在延續(xù)和斷裂交織的時空演進中,其在知識生產(chǎn)等方面扮演的角色擁有更多元的發(fā)展可能。
數(shù)字時代下的歷史書寫
南京大學梁晨教授的報告“什么是好的數(shù)字史學研究?”,以中國臺灣地區(qū)《新史學》集刊創(chuàng)刊號強調(diào)“電子計算機時代下,嘗試各種方法拓展研究眼界”之說法作引,分析了大語言模型、大數(shù)據(jù)分析、歷史地理信息系統(tǒng)、自然語言處理、社會網(wǎng)絡(luò)分析等成熟技術(shù)在引入歷史學研究視域后,技術(shù)與史學書寫之間可迸發(fā)出令人擊節(jié)的火花。但是,梁晨教授強調(diào)數(shù)字史學的核心應(yīng)仍集中于“史學”二字,史料是史學研究的基礎(chǔ)和核心,理論和方法只能作用于史料,才能推動史學研究進步。同時,數(shù)字技術(shù)應(yīng)當為研究者提供新視野、新問題,幫助歷史學家在掌握史料、分析史料等環(huán)節(jié)有所進步,方能展現(xiàn)出其真正價值,故在數(shù)字時代中,歷史學家要認真思考數(shù)字工具契合史學研究規(guī)范的問題。
上海交通大學趙思淵教授則提出了在AIGC時代能否遇見人工智能歷史學家之問。他以自身使用ChatGPT等大語言模型的經(jīng)驗為例進行了討論。趙思淵指出,目前AI技術(shù)在整理、歸納分析一手史料方面,可接近歷史系本科低年級學生的水平,且在提取文本數(shù)據(jù)等方面表現(xiàn)良好。但是,由于AI對文字背后價值觀的判斷是基于語言模式,而非事實本身,故其當下很難“真正”理解人類社會情感態(tài)度等,但隨著AI技術(shù)不斷迭代,這些“門檻”在未來突破并非不可能。就人文學科而言,AI還無法真的提出問題,具有通常所謂的“問題意識”。誠如前輩史家所言,歷史學是史家與史實之間不斷互動作用的過程,人類社會基于交往理性構(gòu)建、證成自我價值與意義的過程也蘊含其中。
上海師范大學劉江副教授結(jié)合教學實際,以《中國歷史文選》課程為例,討論了數(shù)字賦能下課程教學生態(tài)的變化。《中國歷史文選》課程配合中國古代史教學,屬于歷史學本科生培養(yǎng)體系中的主干課,長期以來由于課程難度較大,以及學生經(jīng)歷從高中學習思維向大學的轉(zhuǎn)換過程,故授課教師在學情分析、教學技能與方法等多方面會面臨挑戰(zhàn)。劉江老師在授課時注重數(shù)字技術(shù)在教學過程中的運用,不僅鼓勵學生使用“學習通”等數(shù)字資源進行學習,也通過數(shù)字工具開展學生學情分析,以及閱讀文本挖掘等工作,使該課程的講授方式從原先側(cè)重關(guān)注字詞解釋與疏通文意,轉(zhuǎn)向培養(yǎng)修課同學辨析與解讀史料的能力。
運用數(shù)字工具開展專題研究
上海師范大學林宏副教授以故宮藏清代地球儀圖面修復為案例,分析利用數(shù)字工具活化重要文物的可能性。伴隨著時間推移,故宮藏清代康熙朝地球儀表面發(fā)生皸裂、變形,許多圖面內(nèi)容模糊不清。近年公布的、現(xiàn)存于瑞士的一幅中文世界地圖《坤輿圖》帶來新的研究契機。團隊經(jīng)由數(shù)字檢索獲取相關(guān)高清圖文資料,采用地理文本信息標記與比對分析,可為確定故宮藏地球儀的時間斷限、還原地球儀上本有地名、圖形等要素提供依據(jù),且三維虛擬展示地球儀內(nèi)容的技術(shù)也已有海外先例可循。由此,數(shù)字技術(shù)可在文物修復領(lǐng)域展現(xiàn)出特殊作用。
洛陽師范學院王國強教授則使用影像數(shù)據(jù)庫等數(shù)字資源,結(jié)合文本提取與分析技術(shù),分析了近代西人有關(guān)洛陽的記錄中小尺度地名的翻譯問題。由于在西人拍攝的照片中提及了大量洛陽的舊地名,如何將這些舊地名與今日地理空間對應(yīng),成為研究近代洛陽城市史、河南地區(qū)鐵路交通史等領(lǐng)域的一個有趣問題。王教授通過多年收集相關(guān)影像材料,并提取照片、回憶錄等材料中涉及的小尺度地名,運用地理信息系統(tǒng)加以標記,探討這些地名今日之地理位置。
圓桌會議環(huán)節(jié)由蔣杰副教授主持,中國社會科學院法學研究所孫家紅研究員、上海師范大學梁民愫教授、上海社會科學院經(jīng)濟研究所余開亮助理研究員、華東師范大學歷史系蘇圣捷老師、《探索與雜志》楊義成編輯等專家學者相繼發(fā)言,分別從AIGC時代下歷史學者的學科關(guān)懷、AI發(fā)展融合人類本身的智慧、數(shù)據(jù)導入與精度等AI發(fā)展局限、如何在AI浪潮下保持歷史學者自身特色等問題展開熱烈的討論。與會學者一致認為在前行的技術(shù)時代,歷史學者應(yīng)當善加利用工具,但不能為工具所宰制,同時也需注意當下AI技術(shù)的各類局限。
在AIGC時代,人工智能對歷史學家是機遇還是挑戰(zhàn),在此,我們不妨聆聽一下ChatGPT自身給出的答案:
對于歷史學家來說,AI既是挑戰(zhàn)又是機遇。一方面,AI的發(fā)展可能會改變歷史學家的研究方式和角度,挑戰(zhàn)其傳統(tǒng)的研究方法。例如,AI可以自動化文本分析和數(shù)據(jù)挖掘,加快處理大量歷史資料的速度和效率,但這也可能導致歷史學家失去深入了解歷史的機會。另一方面,AI可以為歷史學家提供更多的數(shù)據(jù)和信息,幫助他們從全新的視野中解析歷史。同時,AI也可以產(chǎn)生新的研究問題和方法,提供更多的思考角度和工具。因此,歷史學家需要具備跟上時代的觀念和技能,積極應(yīng)用AI技術(shù),從而更好地認識歷史。