【主持人語(yǔ):劉永謀(中國(guó)人民大學(xué)吳玉章講席教授)】近年來(lái),以大模型為代表的AI技術(shù)發(fā)展迅猛,掀起一波席卷全球的AI發(fā)展熱潮。關(guān)注AI發(fā)展?fàn)顩r的人不限于AI的研發(fā)者、推廣者和AI發(fā)展的評(píng)論者、人文社科研究者,更包括深感生活將被AI深刻影響的普通公眾。AI發(fā)展的問(wèn)題不再是純粹技術(shù)問(wèn)題,而是成為某種意義上的公共議題。在最近OpenAI發(fā)布Sora、馬斯克開(kāi)源Grok等一系列相關(guān)事件中,這一點(diǎn)表現(xiàn)得非常清楚。在各種相關(guān)公共討論中,AI發(fā)展現(xiàn)狀尤其受到關(guān)注,其中的基本問(wèn)題是:當(dāng)前AI發(fā)展的大方向是否有問(wèn)題,未來(lái)應(yīng)該朝什么方向前進(jìn)。為此,組織計(jì)算機(jī)、經(jīng)濟(jì)學(xué)、馬克思主義理論和哲學(xué)等領(lǐng)域的八位學(xué)者,對(duì)AI發(fā)展現(xiàn)狀進(jìn)行跨學(xué)科反思以期拋磚引玉,求教于方家。
本系列文章共8篇,轉(zhuǎn)載自《科學(xué)·經(jīng)濟(jì)·社會(huì)》2024年第2期,本文《預(yù)測(cè)方法對(duì)AI的限制》為第6篇。在文中,邱德鈞和馮霞認(rèn)為大模型技術(shù)主要以預(yù)測(cè)方法為基礎(chǔ),而這限制了 AI的發(fā)展,使之不能建立完備的“世界模型”。
一、科學(xué)界推理為主流下預(yù)測(cè)方法的興起
如何看待AI發(fā)展的大方向有沒(méi)有問(wèn)題,是不是走在正確的道路上?這個(gè)問(wèn)題被細(xì)化為三點(diǎn):第一,當(dāng)前AI發(fā)展是否言勝于行,或者脫實(shí)向虛,甚至呈現(xiàn)出某種娛樂(lè)化的傾向?第二,當(dāng)前AI發(fā)展在技術(shù)路線、應(yīng)用戰(zhàn)略等方面存在什么局限或問(wèn)題,比如通用人工智能是不是歧路?第三,當(dāng)前AI發(fā)展是否堅(jiān)持了以人為本、為人民服務(wù)的根本宗旨,是不是走上了無(wú)所顧忌的唯科學(xué)主義道路?分析下來(lái),第二點(diǎn)技術(shù)路線的特點(diǎn)和局限最為重要,弄清楚技術(shù)路線的特征,第一點(diǎn)和第三點(diǎn)也就基本清晰了,因此,以下主要來(lái)分析AI發(fā)展的技術(shù)特征,并找出其中的不足。
推理和預(yù)測(cè)在科學(xué)發(fā)展中都非常重要,尤其是邏輯推理,從古希臘的亞里士多德、蓋倫,經(jīng)歷布爾、弗雷格,一直到希爾伯特,邏輯學(xué)的公理化方法和相關(guān)的元邏輯研究影響了許多學(xué)科,大多學(xué)科都有了廣泛的公理化應(yīng)用,使得人們相信依據(jù)基本概念和基本原則,再依靠推理,我們能夠推出未知的真理。然而,隨著Godel不完備定理等結(jié)果的出現(xiàn),人們對(duì)于通過(guò)邏輯系統(tǒng)能否完全描述現(xiàn)實(shí)也產(chǎn)生了更為審慎的觀點(diǎn)。但是,在基本概念、公理下建立某個(gè)領(lǐng)域的理論科學(xué)發(fā)展模式開(kāi)始成為科學(xué)的“范式”,朱迪亞·珀?duì)枺↗udea Pearl)將這種情況稱為“有理論科學(xué)”。
改變發(fā)生在近代,標(biāo)志性的事件是哈雷生命表的出現(xiàn)。由于1462年后基督教和新教為共同對(duì)付伊比利亞半島的摩爾人而加強(qiáng)合作,尤其是科學(xué)探索上的合作一直延續(xù)了下來(lái),到1693年天文學(xué)家哈雷輾轉(zhuǎn)從牛頓處得到了波蘭布雷斯勞小鎮(zhèn)的新教牧師卡斯帕·諾依曼(Caspar Neuman)對(duì)教區(qū)內(nèi)新生兒出生和教區(qū)內(nèi)死亡人數(shù)的記錄表。諾依曼原來(lái)的研究目的是通過(guò)對(duì)人口數(shù)的記錄,確認(rèn)當(dāng)?shù)亻L(zhǎng)期迷信的49歲、63歲和81歲的更年期迷信,哈雷對(duì)之進(jìn)行插值和平滑后,開(kāi)始研究生命的規(guī)律。哈雷生命表的出現(xiàn)有著重要的意義,它表明預(yù)測(cè)與這個(gè)時(shí)候已經(jīng)成熟的古典物理學(xué)和數(shù)學(xué)可以沒(méi)有關(guān)系,而只與數(shù)據(jù)本身相關(guān),其依據(jù)的原理是:未能被我們今天觀察到的未來(lái)事件,通常遵循過(guò)去的運(yùn)行方式發(fā)生。這成了自1693年后幾個(gè)世紀(jì)以來(lái)人們進(jìn)行決策的重要的經(jīng)驗(yàn)原則。從此,依據(jù)統(tǒng)計(jì)進(jìn)行預(yù)測(cè)和依據(jù)邏輯推理得到確定性的知識(shí),這二者一起成為了人類兩個(gè)最重要的知識(shí)來(lái)源,珀?duì)栐谌斯ぶ悄苡懻撚蛳路Q前者為“無(wú)理論科學(xué)”,連接主義正是在此基礎(chǔ)上取得進(jìn)展的。當(dāng)時(shí)正值“九年戰(zhàn)爭(zhēng)”期間,哈雷根據(jù)此表,假設(shè)18~56歲的人能夠拿起武器上戰(zhàn)場(chǎng),根據(jù)人口數(shù)量來(lái)估計(jì)戰(zhàn)爭(zhēng)的兵源數(shù)量,并且依據(jù)每個(gè)年齡段的死亡數(shù)量出售保險(xiǎn)產(chǎn)品,使國(guó)王的收益最大化。自此,預(yù)測(cè)與推理一樣進(jìn)入了科學(xué)研究中。
二、預(yù)測(cè)與推理的不同作用導(dǎo)致AI發(fā)展
推理和預(yù)測(cè)兩者之間存在一些區(qū)別,首先推理的目的是為了得到確定性的結(jié)論,通過(guò)已知事實(shí)和規(guī)律進(jìn)行邏輯推導(dǎo)得出更廣泛或更深層次的知識(shí)。預(yù)測(cè)的目的是擬定未來(lái)可能發(fā)生的情況,通過(guò)分析現(xiàn)有信息推測(cè)可能結(jié)果,利用多種多樣的方法使已知信息盡可能地收斂于期望的結(jié)果。推理依賴于公理、定理和已知事實(shí),其結(jié)論的正確性來(lái)源于前提條件的正確性。預(yù)測(cè)依賴于對(duì)歷史和當(dāng)前趨勢(shì)的分析,需要判斷各種影響因素并權(quán)衡其可能的影響程度。推理能夠得出必然成立的結(jié)論,預(yù)測(cè)結(jié)果則往往是一個(gè)可能范圍或多個(gè)可能結(jié)果,難以確定具體結(jié)果,存在一定程度的不確定性。而且推理通常描述的是靜態(tài)結(jié)論,預(yù)測(cè)結(jié)果是針對(duì)未來(lái)做出的預(yù)估,依據(jù)后驗(yàn)可以動(dòng)態(tài)修正先驗(yàn)。這也進(jìn)而導(dǎo)致推理結(jié)論能通過(guò)邏輯解析求證其真實(shí)性,而預(yù)測(cè)結(jié)果需要隨時(shí)間推移進(jìn)行驗(yàn)證,看是否符合事實(shí)從而成真。其次,推理和預(yù)測(cè)的使用范圍不同,這與本文討論密切相關(guān)。推理適用于任何學(xué)科,是普適性思維框架,預(yù)測(cè)主要用于社會(huì)科學(xué)和實(shí)驗(yàn)科學(xué)對(duì)未來(lái)趨勢(shì)的研究,近期才略微涉足物理科學(xué)。下面就這一點(diǎn)展開(kāi)詳細(xì)討論。
推理可應(yīng)用于任何學(xué)科,只要該學(xué)科具有一定的論證框架和邏輯規(guī)則,就可以進(jìn)行推理得出新的理論或是新的定理。預(yù)測(cè)的使用范圍主要在社會(huì)科學(xué)和實(shí)驗(yàn)科學(xué)中。社會(huì)科學(xué)如經(jīng)濟(jì)學(xué)、政治學(xué)等可以根據(jù)歷史數(shù)據(jù)和當(dāng)前趨勢(shì)來(lái)預(yù)測(cè)社會(huì)、經(jīng)濟(jì)等方面的未來(lái)發(fā)展走勢(shì)。實(shí)驗(yàn)科學(xué)如天文學(xué)可以根據(jù)定律預(yù)測(cè)行星和星體的運(yùn)動(dòng)規(guī)律,氣象學(xué)可以根據(jù)目前條件預(yù)測(cè)未來(lái)一段時(shí)間的天氣變化情況。生物學(xué)也可以根據(jù)細(xì)胞和生命規(guī)律預(yù)測(cè)疾病的發(fā)展趨勢(shì),材料科學(xué)可以預(yù)測(cè)新材料的性能,計(jì)算機(jī)科學(xué)可以預(yù)測(cè)程序的運(yùn)行效率等。推理主要用于論證和解釋現(xiàn)有知識(shí),不一定涉及未來(lái)預(yù)測(cè)。但預(yù)測(cè)需要基于目前對(duì)規(guī)則和趨勢(shì)的理解,通過(guò)一定推理得到可能的未來(lái)狀態(tài)。
更深入地從方法論看,推理和預(yù)測(cè)在科學(xué)研究中也存在不同,這點(diǎn)尤其重要。推理可用于建立理論模型,通過(guò)邏輯演繹得出新結(jié)論,推理結(jié)果的正確與否取決于前提條件,推理結(jié)論具有必然性。這為科學(xué)理論提供理論支持,也成為1950年代以后至1970年代AI中符號(hào)主義路線的信心來(lái)源。預(yù)測(cè)通常需要通過(guò)對(duì)歷史數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,建立數(shù)學(xué)模型,并考慮可能的影響因素,這為科學(xué)實(shí)驗(yàn)和實(shí)踐提供了參考依據(jù)。預(yù)測(cè)得到的結(jié)論需要時(shí)間證實(shí),有時(shí)也可以通過(guò)后續(xù)觀察和驗(yàn)證得到部分證實(shí)。與推理結(jié)果不同,預(yù)測(cè)結(jié)果帶有不確定性因素,但通過(guò)重復(fù)實(shí)驗(yàn),某些預(yù)測(cè)也可以取得較高準(zhǔn)確率,或者依據(jù)經(jīng)驗(yàn)訓(xùn)練為期望的收斂值,尤其是在大數(shù)據(jù)輔助下,可以插值補(bǔ)充缺失數(shù)據(jù)進(jìn)行預(yù)測(cè),或者用復(fù)雜的數(shù)值模擬和深度神經(jīng)網(wǎng)絡(luò)的函數(shù)逼近進(jìn)行預(yù)測(cè)。有人主張推理和預(yù)測(cè)方法上有相同點(diǎn),比如,都需要收集和分析事例資料,了解先前的知識(shí)體系;都需要建立一定的邏輯或數(shù)學(xué)模型并一定程度地抽象描述問(wèn)題。但預(yù)測(cè)方法明顯表現(xiàn)出了新的特征,例如,建立統(tǒng)計(jì)或計(jì)算模型,考慮大數(shù)量的各種影響因素而不是不多的幾個(gè)變量表達(dá)的公式;給出可能結(jié)果范圍或多個(gè)可能結(jié)果,帶有概率性;結(jié)果取決于模型對(duì)復(fù)雜因素的權(quán)重的把握程度。
推理是我們非常熟悉的科學(xué)研究方法,把它和今天人工智能技術(shù)主要依賴的統(tǒng)計(jì)方法的預(yù)測(cè)進(jìn)行比較,就是為了更深入地認(rèn)識(shí)這種預(yù)測(cè)方法能把AI技術(shù)帶到何種方向。
從羅森布拉特開(kāi)創(chuàng)了感知機(jī)的分類和模式識(shí)別方法以來(lái),AI的文本、圖像處理預(yù)測(cè)都大量依據(jù)數(shù)據(jù)分類、聚類、插值運(yùn)算或擴(kuò)散算法,用歷史數(shù)據(jù)(或訓(xùn)練集)來(lái)建立統(tǒng)計(jì)模型或者數(shù)值模擬模型。這些模型通過(guò)數(shù)據(jù)點(diǎn)之間的相關(guān)性分析,利用插值和擬合方法給出新的預(yù)測(cè)值。達(dá)特茅斯會(huì)議參與者們尤其是明斯基(Marvin Minsky)在《計(jì)算幾何學(xué)》里主張的以推理為主導(dǎo)的符號(hào)主義的專家系統(tǒng)出版的第二年,即1971年,就被英國(guó)數(shù)學(xué)家萊特希爾(James Lighthill)報(bào)告宣布是非人工智能。繼承羅森布萊特方法的學(xué)者則以ImageNet庫(kù)為基準(zhǔn)成功開(kāi)發(fā)出了能夠精準(zhǔn)識(shí)別16x16像素的圖像的技術(shù),隨后將該識(shí)別并預(yù)測(cè)圖像的方法用于自然語(yǔ)言處理又獲得了進(jìn)展,直至媒體熱切關(guān)注的AlphaGo依據(jù)大量的圍棋棋譜的統(tǒng)計(jì)數(shù)據(jù)戰(zhàn)勝人類棋手,預(yù)測(cè)方法的能力隨深度神經(jīng)網(wǎng)絡(luò)開(kāi)始進(jìn)入公眾關(guān)注的領(lǐng)域。今天回頭追究其原因,是因?yàn)橄啾扔趶?fù)雜的推理過(guò)程,預(yù)測(cè)問(wèn)題本身通常更容易形式化和量化,比如分類、回歸等。這使得數(shù)據(jù)驅(qū)動(dòng)的連接主義模型表現(xiàn)出強(qiáng)大的能夠聚焦于解決“簡(jiǎn)單”問(wèn)題逐步積累能力。其次,今天深度學(xué)習(xí)模型的發(fā)展和評(píng)價(jià)很大程度上被特定的數(shù)據(jù)集和評(píng)測(cè)任務(wù)所驅(qū)動(dòng)和制約,這些評(píng)測(cè)任務(wù)大多屬于感知預(yù)測(cè)類,缺乏對(duì)認(rèn)知推理能力的綜合考核,或者說(shuō)只集中于數(shù)據(jù)可大量集中的領(lǐng)域發(fā)力,而這些領(lǐng)域正好是統(tǒng)計(jì)預(yù)測(cè)擅長(zhǎng)的地方,其實(shí)在發(fā)展人工智能領(lǐng)域,目前我們有意或無(wú)意地忽略了認(rèn)知中離不開(kāi)的推理能力的要求??傊?,集“解決‘簡(jiǎn)單’問(wèn)題逐步積累能力”和“回避預(yù)測(cè)不擅長(zhǎng)的不具備可統(tǒng)計(jì)的大量數(shù)據(jù)領(lǐng)域”這兩個(gè)根本因素,預(yù)測(cè)方法在今日成了AI中的主流。盡管希望目前以預(yù)測(cè)為主的AI方法能帶領(lǐng)人類突破盡可能多的未知,但在可見(jiàn)的未來(lái)里,隨數(shù)據(jù)枯竭等的到來(lái),推理會(huì)以某種可行的方式進(jìn)入AGI領(lǐng)域。
三、預(yù)測(cè)方法的不足
對(duì)于人類而言,未知域遠(yuǎn)大于已知,邏輯推理等已經(jīng)讓我們建立起了依據(jù)理論擴(kuò)展認(rèn)知領(lǐng)域的習(xí)慣,但理論的建構(gòu)過(guò)于偶然且太過(guò)寶貴,遠(yuǎn)遠(yuǎn)滿足不了人們對(duì)未知的渴求。同時(shí),未知域里的事物未必遵從我們關(guān)于過(guò)去已知的規(guī)律的假設(shè),因此,預(yù)測(cè)也就存在困難,即便承認(rèn)作為統(tǒng)計(jì)學(xué)基礎(chǔ)的U.d假設(shè),但因?yàn)槟P筒豢赡芡耆⒑芎玫夭蹲较到y(tǒng)中的所有重要影響因素,最終會(huì)導(dǎo)致預(yù)測(cè)不可靠而得不到推理的理論給出的確定性知識(shí)。隨著系統(tǒng)復(fù)雜性變高,模型難以完全反映實(shí)際情況。若一味地為保證不遺漏重要因素,必然增加模型復(fù)雜性和計(jì)算負(fù)擔(dān),導(dǎo)致模型不斷擴(kuò)大,最終造成對(duì)計(jì)算量的大幅增加而不可行。今天的GPT-4已使用了2.5萬(wàn)塊H100,能耗和資金投入總會(huì)有限度,產(chǎn)出平衡點(diǎn)也會(huì)對(duì)參數(shù)增加進(jìn)行約束。
哪些才是純數(shù)據(jù)中的重要的影響因素?這不但與數(shù)據(jù)規(guī)模和特征不足有關(guān),還與難以建立可靠的統(tǒng)計(jì)關(guān)系或因果關(guān)系密切相關(guān),后面我們將專門就此討論。數(shù)據(jù)饑渴和匱乏隨著AI訓(xùn)練不久就會(huì)到來(lái),它會(huì)降低預(yù)測(cè)能力。預(yù)測(cè)結(jié)果難以量化誤差范圍,對(duì)結(jié)果的可信度描述不清,產(chǎn)生誤導(dǎo),也會(huì)產(chǎn)生不好的后果。預(yù)測(cè)結(jié)果難以實(shí)時(shí)更新調(diào)整,響應(yīng)新情況反應(yīng)力度不足,以及預(yù)測(cè)應(yīng)用難成為定制決策的有效參考,缺乏應(yīng)用驅(qū)動(dòng)的視角,還有預(yù)報(bào)結(jié)果與決策者之間溝通差或決策者難以接受導(dǎo)致結(jié)果誤導(dǎo)或誤用,預(yù)測(cè)結(jié)果難與事后結(jié)果對(duì)比,缺乏結(jié)果改進(jìn)機(jī)制,等等。這些都是預(yù)測(cè)的不足之處。
2009-2018年,珀?duì)柕呐κ挂蚬P(guān)系成為現(xiàn)象級(jí)焦點(diǎn),但數(shù)據(jù)中因果關(guān)系的發(fā)現(xiàn)固然重要,系統(tǒng)復(fù)雜性卻造成預(yù)測(cè)的困難,加上預(yù)測(cè)方法與應(yīng)用驅(qū)動(dòng)能力不總是匹配,使得實(shí)際在處理因果關(guān)系時(shí),需要調(diào)整模型、數(shù)據(jù)、應(yīng)用三者之間的關(guān)系。由于因果關(guān)系的基本難題存在,也就是我們總是只能觀察到事實(shí)或者反事實(shí)之一而不能同時(shí)觀察到二者,于是采用平均因果效應(yīng)來(lái)近似個(gè)體因果效應(yīng),但面對(duì)個(gè)體的異質(zhì)性問(wèn)題卻無(wú)法處理,因此很難發(fā)現(xiàn)有關(guān)個(gè)體的因果關(guān)系,這使得在因果關(guān)系的相關(guān)研究中天然設(shè)置了一道無(wú)法逾越的障礙。珀?duì)栂肜靡蚬P(guān)系給“無(wú)理論”的預(yù)測(cè)方法找到一個(gè)可信的基礎(chǔ),至少?gòu)慕裉斓囊蚬碚摤F(xiàn)狀來(lái)看還十分困難。就在幾天前,珀?duì)栔鲝堧S著依據(jù)推理的“有理論科學(xué)”和進(jìn)行預(yù)測(cè)的“無(wú)理論科學(xué)”的發(fā)展,人類也許會(huì)創(chuàng)造出高于二者的元理論,就他這種觀點(diǎn)來(lái)看至少他本人對(duì)于純數(shù)據(jù)中因果關(guān)系的發(fā)現(xiàn)已經(jīng)產(chǎn)生了動(dòng)搖。
這樣一來(lái),預(yù)測(cè)的諸多難題至今沒(méi)有辦法解決。這些難題也正是大眾對(duì)現(xiàn)今的AI技術(shù)在接受上存在一些困難的根本原因,換句話說(shuō),連結(jié)主義依靠預(yù)測(cè)技術(shù)成就了今天的AI技術(shù),也戰(zhàn)勝了符號(hào)主義,但也天然地束縛住了自己。
不可忽視預(yù)測(cè)結(jié)果難以被大眾接受的另一個(gè)重要原因,AI在文本、視頻等領(lǐng)域因可采集的大量數(shù)據(jù)使得效果非常優(yōu)異,但也因此在一定程度上讓人質(zhì)疑目前AI的發(fā)展方向是否偏于娛樂(lè)。但是,目前數(shù)學(xué)和邏輯模型都無(wú)法完全捕捉和表達(dá)人類語(yǔ)言的全部含義,特別是在處理含有豐富語(yǔ)義細(xì)節(jié)的自然語(yǔ)言文本或視頻內(nèi)容時(shí)。更具體來(lái)說(shuō),人類語(yǔ)言中不僅包含邏輯關(guān)系,更包含豐富的隱喻、比喻、語(yǔ)境等語(yǔ)義層面,這對(duì)現(xiàn)有模型來(lái)說(shuō)難以完全理解和表達(dá)。數(shù)據(jù)很難在量化數(shù)值的形式中完整呈現(xiàn)物理世界中諸如重量、色調(diào)、氣味等類型的信息。人類情感和心理狀態(tài)很難用數(shù)值壓縮而不失真,這也成為模型難以預(yù)測(cè)人類行為的原因?,F(xiàn)有模型在處理包括時(shí)間和空間在內(nèi)的豐富上下文關(guān)系時(shí)也存在限制。語(yǔ)言之間的多義性和歧義也增加了預(yù)測(cè)結(jié)論的不確定性。如果模型能更好地理解和再現(xiàn)語(yǔ)言中的語(yǔ)用層面和豐富上下文關(guān)系,其預(yù)測(cè)結(jié)果很可能會(huì)受到更廣泛的認(rèn)可。這也將是未來(lái)研究的一個(gè)重要方向。
有觀點(diǎn)質(zhì)疑語(yǔ)言的歧義性會(huì)影響AI的預(yù)測(cè)結(jié)果,另一方面則有人認(rèn)為該問(wèn)題已經(jīng)被符號(hào)邏輯解決。但在廣泛的應(yīng)用領(lǐng)域,符號(hào)化并沒(méi)有完全覆蓋。除語(yǔ)言本身的歧義性外,人類智力活動(dòng)中還包含一些無(wú)法通過(guò)明確輸出來(lái)表達(dá)的內(nèi)容,這也給預(yù)測(cè)計(jì)算帶來(lái)難度。人類在思考和交流中,會(huì)采用暗示、隱喻、語(yǔ)用等手段來(lái)表達(dá)想法,而非一定以直接明確的語(yǔ)句為輸出。比如表達(dá)同情不用語(yǔ)言直接說(shuō)出,而用語(yǔ)調(diào)和眼神交流,這些很難僅通過(guò)語(yǔ)言數(shù)據(jù)準(zhǔn)確捕捉。情緒和態(tài)度也往往通過(guò)細(xì)微表情和肢體語(yǔ)言來(lái)傳達(dá),但這些很難從文字中讀取。思考過(guò)程本身就是一個(gè)無(wú)形的過(guò)程,包含推斷、聯(lián)想等步驟,這不能直接從交流中反映出來(lái)。在沉思或猶豫時(shí),人可能會(huì)選擇暫時(shí)不給出明確回復(fù),這對(duì)模型來(lái)說(shuō)很難處理。藝術(shù)和文學(xué)創(chuàng)作也需要大量隱喻與象征,難以單純依靠邏輯關(guān)系進(jìn)行表達(dá)。這說(shuō)明人類智能活動(dòng)中,存在著廣泛的隱而不示區(qū)域,這對(duì)計(jì)算模型的訓(xùn)練數(shù)據(jù)和評(píng)估標(biāo)準(zhǔn)提出了新的挑戰(zhàn),也應(yīng)成為接下來(lái)AI要發(fā)展的領(lǐng)域。
四、預(yù)測(cè)不能建立完備的“世界模型”
早期的阿西莫夫機(jī)器人原則,雖然文字上回避了“應(yīng)當(dāng)”“必須”等模態(tài)詞,但本質(zhì)上是對(duì)機(jī)器人行為的約束。今天楊·立昆(Yarni Lecun)借世界模型提出了更為全面的理論,主張agent在與世界的交互中通過(guò)學(xué)習(xí)建立世界模型。二者相結(jié)合,能形成agent在對(duì)世界理解的基礎(chǔ)上加以約束后按照人類利益導(dǎo)向展開(kāi)行動(dòng)的基本框架。簡(jiǎn)言之,與世界交互、學(xué)習(xí)并約束,達(dá)成對(duì)agent該有的“世界觀”的構(gòu)建。邏輯推理在給定前提下得到確定的結(jié)論天然地被用來(lái)建立可信的世界模型,模態(tài)邏輯尤其擅長(zhǎng)約束性規(guī)則。但從近70年的AI發(fā)展看,推理在方法上應(yīng)對(duì)不了一般原則向復(fù)雜具體應(yīng)用的映射,至少可從今日NLP中的機(jī)器翻譯中主要以詞之間的距離分類、聚類取得成功而不是以語(yǔ)法原則取得成功窺見(jiàn)一斑,原則與應(yīng)用之間存在的不只是距離遙遠(yuǎn),許多領(lǐng)域可能需要的不是“有理論的科學(xué)”。那么,依靠預(yù)測(cè)能夠建立起世界模型嗎?
預(yù)測(cè)方法已經(jīng)被證明能學(xué)習(xí),agent也能與環(huán)境交互,算法能進(jìn)行收斂并約束每次計(jì)算,本質(zhì)上預(yù)測(cè)也能形成agent的世界模型,但過(guò)程的復(fù)雜性導(dǎo)致非專業(yè)的大眾不理解,這一點(diǎn)又反作用于學(xué)術(shù)界最終成為一個(gè)需要討論的問(wèn)題。但從agent與世界的交互以及agent之間的交互來(lái)看,即便感知、采集、數(shù)據(jù)化后學(xué)習(xí)以及多個(gè)agent之間交互的問(wèn)題全部能夠解決,并且最終使得agent能形成數(shù)據(jù)化的世界模型,其結(jié)果,模型也必然是不完備的,因?yàn)閺哪壳皝?lái)看,在建立世界模型之前,至少存在這幾個(gè)具體的問(wèn)題需要解決,而目前依據(jù)預(yù)測(cè)方法發(fā)展起來(lái)的AI模型是沒(méi)有將其解決的:
1.暗示:用眼神表示“我們換個(gè)地方繼續(xù)談”而不直接說(shuō)出。
2. 隱喻:在聊天中說(shuō)“剛才網(wǎng)速像拖著鉛塊”來(lái)描述網(wǎng)絡(luò)很慢。
3. 語(yǔ)用:同事問(wèn)“今天晚上有什么安排嗎”,實(shí)際上暗示可以一起吃晚飯。
4. 表達(dá)情緒:在聽(tīng)到噩耗時(shí)眉頭緊鎖,用手不自覺(jué)地握著衣角來(lái)表達(dá)難過(guò)。
5. 思考過(guò)程:看著相冊(cè)發(fā)呆,腦海中回想起以前種種細(xì)節(jié)但沒(méi)有明顯外部行為。
6. 暫緩回復(fù):朋友提出問(wèn)題,自己需要時(shí)間沉思而沒(méi)有當(dāng)場(chǎng)給出答復(fù)。
7. 藝術(shù)創(chuàng)作:有作家喜歡用鳥代表自由,這在小說(shuō)中是常用的隱喻手法。
8. 肢體交流:母親以腿蓋住孩子,以隱喻的方式表達(dá)母愛(ài)。
現(xiàn)實(shí)中允許多義、轉(zhuǎn)義、模糊等方法從而通過(guò)有限的詞匯去表達(dá)一個(gè)無(wú)限豐富的世界,計(jì)算技術(shù)中的有限性和確定性不允許上述方法存在,Transformer等模型用整數(shù)標(biāo)注詞匯,忽略了詞匯在語(yǔ)義空間中的真實(shí)含義是多重或模糊的。目前,預(yù)測(cè)計(jì)算在建立agent的世界模型時(shí)對(duì)抽象概念、連續(xù)性、過(guò)程性概念度量和表達(dá)的缺陷一定會(huì)限制AI的能力從而構(gòu)建不完備的模型。價(jià)值觀上agent對(duì)齊人類價(jià)值已經(jīng)有許多研究成果,但agent如何自我認(rèn)知還是較少討論的問(wèn)題,結(jié)合以上兩點(diǎn)再加上克服了上述缺陷的預(yù)測(cè)方法建立起來(lái)的世界模型,應(yīng)該才是完整的。具有“三觀”的機(jī)器人一定會(huì)變?yōu)槿祟惸芙邮懿⒐蔡幍臋C(jī)器人。當(dāng)然,這是AI發(fā)展的遠(yuǎn)期目標(biāo)。
即便目前AI發(fā)展因不能建立完備的世界模型而受限,但目前的AI進(jìn)展在縮小人與人之間的智力水平方面也將發(fā)揮巨大作用,如同大航海造成歐洲人文化進(jìn)步一樣這也將造成人類整體知識(shí)能力的提高。曾經(jīng)很高門檻的編程,現(xiàn)在只需要看看視頻教程,看看提示工程(prompt),孩童都能用它(AI)做出驚人的事情。AI必將縮小人類在很多前沿技術(shù)領(lǐng)域的差距。