2022年11月30日,OpenAI公司的聊天機(jī)器人ChatGPT上線。半個月之后,就有在美國大學(xué)教書的友人說起ChatGPT引發(fā)了自己對工作的焦慮。2023年9月,《美國歷史評論》專門探討21世紀(jì)歷史研究新實(shí)踐的欄目的“歷史實(shí)驗(yàn)室”(History Lab)發(fā)表了一組題為《人工智能和歷史實(shí)踐》的圓桌論文,及時回應(yīng)了美國同行對人工智能是什么以及能如何與歷史學(xué)進(jìn)行互動的疑問。七篇文章關(guān)聯(lián)到了對歷史學(xué)研究者來說相對更熟悉的議題,比如“數(shù)字史學(xué)”,更多的則是一些相對新的名詞,比如“深度學(xué)習(xí)”“噪聲效應(yīng)”等等。
中文媒體對人工智能的興趣在2023年達(dá)到一個新高度。高等院校同樣如此。例如,2023年12月28日,美國羅文大學(xué)杰出教授王晴佳受復(fù)旦大學(xué)西方史學(xué)史團(tuán)隊邀請作了題為《數(shù)字化、人工智能和歷史學(xué)的未來》的講座,全面而深入地講述了人工智能對歷史研究的影響,讓筆者深受啟發(fā)。
在剛剛過去的龍年春節(jié)期間,OpenAI發(fā)布的文本到視頻轉(zhuǎn)換模型Sora展現(xiàn)的樣片又引發(fā)了一輪激烈的討論。無論用戶的要求是刻畫當(dāng)代時尚女性行走在東京商業(yè)區(qū)的情景,還是模擬淘金熱期間的加利福尼亞州的樣貌,Sora都能較為準(zhǔn)確乃至栩栩如生地實(shí)現(xiàn)。OpenAI甚至聲稱Sora能夠理解用戶輸入的內(nèi)容在物理世界中的存在方式,這使得以往的AI視頻生成工具相形見絀。
與此同時,谷歌在大模型信息處理能力的賽道持續(xù)發(fā)力,推出了Gemini 1.5 Pro。據(jù)稱它可以處理高達(dá)100萬個tokens的上下文窗口,差不多對應(yīng)一小時的視頻、11小時的音頻、超過30,000行代碼的代碼庫或超過700,000字的文本(約等于《伊利亞特》和《奧德賽》的文本量相加再翻一倍)。這些革新體現(xiàn)出人工智能(Artificial Intelligence)的計算能力在不斷以驚人的速度提升?!督?jīng)濟(jì)學(xué)人》雜志在2023年2月初刊載了《人工智能的繁榮:歷史的經(jīng)驗(yàn)》一文,將GPT的出現(xiàn)和亨利·福特的企業(yè)開始使用流水線生產(chǎn)汽車相提并論。易言之,人工智能的繁榮將不僅僅是信息技術(shù)領(lǐng)域快速發(fā)展的標(biāo)志。由此而生的新技術(shù)、新產(chǎn)品和新服務(wù)很快會滲透到人類生活的許多角落,進(jìn)而催生人類社會的變化。
你與AI的距離:很近又很遠(yuǎn)
對于身處高校的學(xué)者和學(xué)生而言,AI大模型及相關(guān)產(chǎn)品快速迭代帶來了許多視覺和心理上的沖擊。在應(yīng)用層面上,對于數(shù)據(jù)科學(xué)(Data Science)的研究者和依賴電腦進(jìn)行大數(shù)據(jù)分析的研究者(包括數(shù)字人文的研究者)來說,早已熟稔ChatGPT,大模型、機(jī)器學(xué)習(xí)之類的概念,各種分析工具和代碼工具已融入自己核心的工作流,創(chuàng)造出擁有極佳視覺效果的學(xué)術(shù)成果。不過,更多的師生是利用聊天機(jī)器人來處理郵件措辭、文章改寫、日常報告生成等重復(fù)性強(qiáng)的瑣事?!八嚫呷四懘蟆钡摹靶驴萍紣酆谜摺眲t可能在過去一年里體會到了大語言模型的“致幻術(shù)”,如從機(jī)器人那里獲得了“西南聯(lián)大的重要創(chuàng)始人之一楊開慧成功參加了位于蘇黎世的第七屆國際數(shù)學(xué)家大會并獲得了惟一的一枚銅牌”這樣的“新知”,著實(shí)為痛苦的期末周送來了富有新意的笑料,強(qiáng)化了人工智能聊天機(jī)器人仍是“人工智障”的刻板印象。
從學(xué)術(shù)研究的角度來看,有鑒于中文歷史學(xué)期刊的論文發(fā)表周期動輒以年計算,且仍有許多刊物無法給文章配圖,要針對正在迅速發(fā)展的、媒體形式極為多樣的人工智能展開討論存在相當(dāng)大的困難。英文的歷史學(xué)期刊則在ChatGPT面世后不久,便開始傳遞不同領(lǐng)域?qū)W者的洞見。例如,《歷史與理論》雜志在2022年12月出版了《數(shù)字歷史和理論》???。其中收錄的10篇專論針對人工智能時代下的歷史學(xué)與歷史敘事等宏觀主題展開辯論,關(guān)注焦點(diǎn)則是史學(xué)理論層面的思考。
其中馬尼·休斯-沃林頓(Marnie Hughes-Warrington)在有關(guān)數(shù)字歷史和理論的??习l(fā)表的《走向?qū)θ斯v史創(chuàng)造者的認(rèn)可》已經(jīng)提到了AI在歷史編纂學(xué)中的潛力。他認(rèn)為,人工智能的歷史學(xué)應(yīng)用不僅局限于模仿人類的歷史敘事,而是通過結(jié)合推理和普遍接受的觀點(diǎn),形成了一種新的歷史敘事方式。沃爾夫·坎斯泰納(Wulf Kansteiner)則在《歷史學(xué)家的數(shù)字興奮劑:歷史、記憶和歷史理論能否人工智能化?》一文中指出,雖然GPT生成的文本無法保證結(jié)構(gòu)上的真實(shí),但史學(xué)理論家可以讓定制的大型語言模型編寫一系列關(guān)于相同事件的描述性、敘事性和論證性歷史,從而探究描述、敘述和論證在歷史寫作中的精確關(guān)系。
上述學(xué)者的討論固然在理論層面頗有建樹,但鮮少涉及大型語言模型產(chǎn)品的具體使用方法和技巧。為數(shù)不多的例外是美國林登伍德大學(xué)(Lindenwood University)的學(xué)者團(tuán)隊在2023年年底在《元宇宙》(Metaverse)上發(fā)表的論文《數(shù)字歷史人物復(fù)活:以瑪麗·西布莉?yàn)槔亩ㄖ艭hatGPT案例研究》。該文以林登伍德大學(xué)的創(chuàng)始人瑪麗·西布莉(Mary Sibley)為實(shí)驗(yàn)對象,將她的海量日記內(nèi)容作為Claude 2.0的訓(xùn)練數(shù)據(jù),開發(fā)出一個能夠復(fù)現(xiàn)西布莉獨(dú)特語調(diào)和觀點(diǎn)的聊天機(jī)器人,類似于2019年熱播日劇《輪到你了》第二季中的AI女主角。這一成果展現(xiàn)了一種新穎的歷史研究和互動學(xué)習(xí)方式,也為學(xué)界如何利用數(shù)字技術(shù)復(fù)現(xiàn)擁有海量史料的歷史人物提供了啟發(fā)。
實(shí)際上,當(dāng)下大語言模型產(chǎn)品的能力已經(jīng)足夠成為高校師生日常課程學(xué)習(xí)和科研工作的助手,在信息檢索、文獻(xiàn)閱讀、筆記管理乃至科研創(chuàng)新等事務(wù)中發(fā)揮關(guān)鍵作用。尤其對于全球史的研究者來說,常常需要處理大量涵蓋了不同地區(qū)、國家和文明間的相互聯(lián)系與比較的材料和文獻(xiàn)。運(yùn)用AI產(chǎn)品來提高信息檢索效率和處理能力,有助于更深入地探索和分析這些復(fù)雜的歷史關(guān)系,來提高研究的深度和質(zhì)量。然而問題在于,如何將AI產(chǎn)品整合到自己的學(xué)習(xí)或工作流程之中,優(yōu)化或定制自己的專屬機(jī)器人,為其增添功能,提升自己的輸入和輸出效率,也就是利用人工智能來自我賦能,從而更高效地處理龐雜的信息。
絕知此事要躬行:管窺國內(nèi)大模型產(chǎn)品工具箱
目前大部分人使用大語言模型產(chǎn)品的方式是直接以自然語言輸入自己的問題到對話框,并等待AI的回復(fù),仿佛在與一位真人助手交談。這簡單的過程中其實(shí)蘊(yùn)含著很多值得學(xué)習(xí)的工具性知識。在互動中,AI回復(fù)的質(zhì)量與大模型自身能力密切相關(guān),也受到用戶發(fā)出的提示詞(Prompt)內(nèi)容的重要影響。固然,目前網(wǎng)絡(luò)上已經(jīng)存在許多詳細(xì)的提示詞指南,但一份理想的提示詞是需要用戶自己在反復(fù)實(shí)踐的互動中不斷地錘煉出來的,這就要求用戶所處的網(wǎng)絡(luò)社區(qū)中有AI產(chǎn)品滿足以下需求:易獲得、模型性能好,且有充足社區(qū)資源提供指導(dǎo)。
除了前文提到的ChatGPT和Gemini Pro這兩個大模型領(lǐng)域的“當(dāng)紅流量小花”,國內(nèi)也有不少相當(dāng)優(yōu)秀的同類產(chǎn)品可供使用。比如月之暗面科技推出的智能聊天機(jī)器人(Chat bot)Kimi Chat就有驚艷的長文本處理能力,能夠支持長達(dá)20萬漢字的輸入。又如清華系創(chuàng)業(yè)公司的智譜AI。用戶可以在智譜清言的客戶端體驗(yàn)GLM-4支持的“長文檔解讀”“高級聯(lián)網(wǎng)”“數(shù)據(jù)分析”“AI畫圖”等多樣化功能。尤其,這一開放平臺目前向?qū)嵜J(rèn)證的新用戶免費(fèi)贈送數(shù)百萬tokens,對想要進(jìn)一步探索AI世界的新手十分友好。字節(jié)跳動推出的智能體創(chuàng)建平臺“扣子”(Coze)同樣頗受好評,原因在于能讓缺乏編程經(jīng)驗(yàn)的“小白”快速上手制作自己專屬的聊天機(jī)器人,并利用知識庫(Knowledge),插件(Plug-in),工作流(Workflow)等功能增強(qiáng)機(jī)器人的性能。
當(dāng)然,選擇哪款大語言模型產(chǎn)品最終取決于個人的需求或偏好。用戶如何通過持續(xù)的使用和探索,找到能夠融入自身現(xiàn)有工作流的工具,從而有效提升學(xué)習(xí)和工作效率才是關(guān)鍵。接下來我將以學(xué)習(xí)第一次世界大戰(zhàn)的歷史為應(yīng)用情境,利用Kimi Chat、智譜AI開放平臺、“扣子”來簡單展示如何使用提示詞優(yōu)化(Prompt Optimization)、知識庫、插件來提升模型的回答質(zhì)量,使之成為歷史學(xué)的學(xué)習(xí)與科研助手。
四兩撥千斤:人工智能助手的快速優(yōu)化策略
聊天機(jī)器人的回答質(zhì)量受到模型的數(shù)據(jù)集和參數(shù)影響,目前,許多從事垂直領(lǐng)域大模型開發(fā)的研究者積極應(yīng)用微調(diào)(fine-tuning)技術(shù)來訓(xùn)練大語言模型,使之在特定領(lǐng)域有更好的表現(xiàn)。但大部分非計算機(jī)專業(yè)的師生并不具備微調(diào)所需的算力資源和專業(yè)知識,掌握這一技術(shù)的時間成本也足以令人望而卻步。但是,在不改變模型的前提下,從用戶開始琢磨自己想問什么,到聊天機(jī)器人最終給出回復(fù),中間有許多步驟提供了可優(yōu)化的空間(如下面的流程圖所示的A和D),來盡可能地使機(jī)器人的回復(fù)貼合用戶所期待的答案。換言之,在人機(jī)互動中,大語言模型聊天機(jī)器人通過其預(yù)訓(xùn)練能力理解用戶輸入,并可能結(jié)合實(shí)時檢索來響應(yīng)查詢。用戶可以做的,則是向機(jī)器人更明確表述自己的需求,“教”機(jī)器人如何提取某些信息,這往往可以通過系統(tǒng)的“提示詞工程”(Prompt Engineering)來實(shí)現(xiàn)。而提供知識庫或插件,則是為機(jī)器人在最終生成回復(fù)之前提供額外的信息支持,市面上大部分大語言模型產(chǎn)品已為缺乏編程和機(jī)器學(xué)習(xí)基礎(chǔ)的用戶提供了此類服務(wù),相信大家可以花費(fèi)較短的學(xué)習(xí)時間來掌握相關(guān)應(yīng)用。
以下是三個與第一次世界大戰(zhàn)史有關(guān)的研究情境中如何使用Chat bot的簡單視頻介紹,筆者在這里拋磚引玉,希望能夠激發(fā)大家的好奇心,去大膽使用這些產(chǎn)品,將自己的聰明才智和人工智能技術(shù)結(jié)合,探索出學(xué)習(xí)的新方法,攀登上學(xué)術(shù)的新高峰。
情境1: 有關(guān)第一次世界大戰(zhàn)研究的文獻(xiàn)管理(04:01)