大國(guó)之間的合作,比如中美之間,在雙方缺乏信任的前提下如何能夠培育出合作和互信?一個(gè)有益的思路就是把一次性的囚徒困境博弈轉(zhuǎn)化成重復(fù)博弈和多邊博弈。囚徒困境的結(jié)局只會(huì)是背叛,這是由人性與國(guó)際關(guān)系的叢林法則所決定的,但是如果能夠轉(zhuǎn)變成重復(fù)博弈和多邊博弈,我們就可以通過(guò)以牙還牙策略(tit for tat)誘導(dǎo)出妥協(xié)和合作,最終培育出信任與和平。
合作還是背叛?
關(guān)于為人處世,不同的先哲留下了不同的教誨。有人主張以德報(bào)怨,要寬恕,以免冤冤相報(bào)無(wú)窮無(wú)盡;也有人主張要以直報(bào)怨,也就是中國(guó)外交政策經(jīng)常說(shuō)的,按照事情本身的是非曲直去確定我們的態(tài)度,而不是根據(jù)以往的恩怨來(lái)考慮當(dāng)前的具體態(tài)度。在西方這種爭(zhēng)論更加激烈,《圣經(jīng)·舊約》主張,要以眼還眼,以牙還牙;《圣經(jīng)·新約》主張被人扇了左耳光,還要把右臉貼過(guò)去。所有這些道德性的、價(jià)值性的、倫理性的、形而上的爭(zhēng)論是無(wú)休無(wú)止、無(wú)窮無(wú)盡的,是沒有定論的。所幸現(xiàn)代社會(huì)科學(xué)的發(fā)展,給我們對(duì)相關(guān)問(wèn)題提供了某些科學(xué)化的解釋。
美國(guó)密歇根大學(xué)的政治學(xué)教授羅伯特·艾克斯羅德在20世紀(jì)80年代曾經(jīng)進(jìn)行過(guò)一項(xiàng)非常有意思的研究,利用囚徒困境的博弈論原理來(lái)研究自私的人類何以可能相互信任并進(jìn)行合作,由此進(jìn)一步解答對(duì)于個(gè)人和國(guó)家來(lái)講,什么樣的處世之道是最合理的。后來(lái),他把這項(xiàng)研究整理為《合作的進(jìn)化》一書,得到同為博弈論研究者的2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主托馬斯·謝林的強(qiáng)烈推薦。
要理解他的研究,首先要明確什么是囚徒困境。囚徒困境是博弈論中最常見的基礎(chǔ)模型,假設(shè)有甲、乙兩個(gè)罪犯被分別提審,他們可以互相揭發(fā)檢舉從而獲得減刑或獎(jiǎng)勵(lì);但是如果他們一起保持沉默的話,就死無(wú)對(duì)證,兩個(gè)人都會(huì)被無(wú)罪釋放。對(duì)于甲個(gè)人而言,如果保持沉默,可能會(huì)遭到乙的背叛,被從重判罰,也可能乙同樣沉默,兩人均被無(wú)罪釋放;但是如果坦白從寬,可能甲、乙互相背叛,各自減刑,也可能乙把秘密帶進(jìn)了棺材,而甲領(lǐng)到了懸賞金。無(wú)論乙怎么選擇,甲的坦白都能讓他自己獲得給定乙選擇下的較好結(jié)局,而且甲也明白乙也面臨著同樣的選擇和誘惑。所以假如這兩個(gè)人都是自私的,不為對(duì)方考慮的,這種博弈的均衡結(jié)果必然是兩個(gè)人各自招供,都被判刑。
一個(gè)更加關(guān)鍵的問(wèn)題是關(guān)于人性自私的假設(shè),處于囚徒困境中的個(gè)體是不是以個(gè)人利益的最大化為唯一訴求?關(guān)于這一點(diǎn),生物學(xué)其實(shí)已經(jīng)提供了很多答案。所謂物競(jìng)天擇,絕大部分生物的基因都是自私的,因?yàn)槟切┰敢鉅奚约簛?lái)?yè)Q取別的個(gè)體生存概率最大化的利他個(gè)體大都滅絕了。不過(guò)自然界中也的確存在例外,一些利他主義基因能夠通過(guò)生存競(jìng)爭(zhēng)繁衍下來(lái),最典型的就是螞蟻、蜜蜂這兩種生物。螞蟻跟蜜蜂可以為了保護(hù)集體、保護(hù)“他人”而犧牲自己,比如螞蟻抱團(tuán)過(guò)河,最外邊圈層的個(gè)體就淹死了;蜜蜂蜇人也是自殺式攻擊,犧牲小我保護(hù)大家。什么原因?qū)е逻@種利他主義基因能夠不滅絕?它們具有一個(gè)共性,同一族群內(nèi)兩兩個(gè)體之間的基因共享度達(dá)到75%。因此,對(duì)于確保整個(gè)種群的延續(xù)而言,只要犧牲某個(gè)體可以挽救其他一又三分之一的個(gè)體,這種交易就是可以接受的,換句話說(shuō),個(gè)體間基因共享程度越高,損失某個(gè)體對(duì)種群基因多樣性所帶來(lái)的成本越小。舉個(gè)極端點(diǎn)的例子,如果個(gè)體間的基因100%共享,也就是所有個(gè)體都是一模一樣的,哪怕只有一只活下來(lái)了,整個(gè)種群的基因也都能夠得到延續(xù)。所以,雖然采取利他行動(dòng)“舍己為人”的螞蟻和蜜蜂死去了,但是這種利他基因仍然存在于因它的犧牲而活下去的個(gè)體里。
交代完這兩個(gè)基本的問(wèn)題之后,我們就可以分析羅伯特·艾克斯羅德教授的精彩研究了。在他看來(lái),每次人際交往都可以簡(jiǎn)化為兩種基本模式,合作與背叛。在人際交往中普遍存在囚徒困境,明知合作可以帶來(lái)共贏,但是理性和自私導(dǎo)致信任的缺乏,使合作難以產(chǎn)生。從理性的角度考慮,人們總是希望對(duì)方采取合作行動(dòng)而自己選擇背叛,由對(duì)方承擔(dān)全部成本,而自己獲得最大化收益;即便你自己不貪心,你也難以相信對(duì)方會(huì)跟你一樣不貪心,所以單次博弈中,很難產(chǎn)生合作的結(jié)局。
但是假如人與人之間的交往不再是一錘子買賣,而是低頭不見抬頭見,需要長(zhǎng)期互利共生,這時(shí)的博弈格局就不一樣了,人們往往愿意這次吃點(diǎn)兒小虧以換取對(duì)方下一次的回報(bào),雙邊關(guān)系就容易穩(wěn)定。所以熟人社會(huì)中的個(gè)體之間是友善的,鄉(xiāng)里鄉(xiāng)親間是講規(guī)矩的,大家互相體諒,互相謙讓。在不定次的重復(fù)博弈中,每個(gè)決策主體都需要考慮自己的行為會(huì)不會(huì)招致對(duì)方的報(bào)復(fù),同時(shí)也希望自己能夠獲得更大的收益,所以往往對(duì)于“背叛”的選項(xiàng)十分慎重,“合作”反而成為比較占優(yōu)的策略。
最優(yōu)策略——以牙還牙
在多主體間開展的不定次重復(fù)博弈中,是否存在一種為人處世的最優(yōu)策略?艾克斯羅德教授向全世界不同學(xué)科的學(xué)者發(fā)出邀請(qǐng),請(qǐng)他們提交各自認(rèn)為最優(yōu)的競(jìng)爭(zhēng)策略,然后通過(guò)計(jì)算機(jī)進(jìn)行模擬,讓這些策略重復(fù)進(jìn)行兩兩之間的囚徒困境博弈,并對(duì)囚徒困境博弈各結(jié)果賦值不同的分?jǐn)?shù),以得分最高者為優(yōu)勝。第一輪參賽的有14個(gè)程序,最終以牙還牙策略獲得了第一。艾克斯羅德教授把這個(gè)策略向全世界公開,并邀請(qǐng)學(xué)者們基于第一輪競(jìng)賽的結(jié)果設(shè)計(jì)更多的策略以開展第二輪競(jìng)賽,這次有63種策略參賽,而優(yōu)勝者仍然是以牙還牙。
以牙還牙策略來(lái)源于一句美國(guó)俗語(yǔ),就是一報(bào)還一報(bào)的意思,它的內(nèi)容非常簡(jiǎn)單,第一步一定要跟對(duì)方合作,此后每一步都只是簡(jiǎn)單地重復(fù)對(duì)方上一步的行為。如此簡(jiǎn)單的程序之所以能夠在兩輪競(jìng)賽中都獲勝,是因?yàn)樗軌蜃钣行У毓膭?lì)其他程序和它進(jìn)行長(zhǎng)期合作。它擁有五個(gè)基本特質(zhì),第一是善良的,它首先假設(shè)這個(gè)世界對(duì)我是好的;第二是可激怒的,它不是老好人,假如它發(fā)現(xiàn)對(duì)方是個(gè)壞蛋,它就會(huì)報(bào)復(fù);第三是寬容的,也就是對(duì)方跟它進(jìn)行了惡性互動(dòng)之后,如果對(duì)方棄惡從善重新與它合作,它又可以原諒對(duì)方,再次跟對(duì)方進(jìn)行合作;第四個(gè)是簡(jiǎn)單的,它的邏輯非常清楚,而且樂于告訴別人它的策略;第五個(gè)是不妒忌別人的成功,總是樂于與別人合作,而不是背后占別人便宜,所以在任何單次的雙邊博弈中,它的得分要么和對(duì)方一樣,要么略低于對(duì)方。
比賽中的其他策略,或多或少都沒有做到以上五點(diǎn)。有些惡意程序,第一步就選擇背叛,最終都沒有進(jìn)入前10名;而有些程序又太過(guò)好脾氣,所以被人背叛之后不立即做出反應(yīng),這就會(huì)鼓勵(lì)狡猾的程序反復(fù)占它的便宜;某些程序?qū)^(guò)往關(guān)系的好壞太過(guò)執(zhí)著,一旦被別人欺騙一次就絕不原諒,所以很多能夠恢復(fù)的關(guān)系就永久斷絕了;還有一些程序把自己搞得太復(fù)雜,總是試圖通過(guò)某種投機(jī)取巧來(lái)占人便宜,盡管在與某些“傻”程序的接觸中得到了單次的高分,但是一旦碰到“個(gè)性剛烈”的程序就會(huì)陷入互相“死磕”的困境,從最后總得分來(lái)講,它們的小聰明都是得不償失的。
自從1999年拜讀了艾克斯羅德教授的研究之后,我就被他此項(xiàng)研究設(shè)計(jì)的巧妙和結(jié)論的高明折服,在為人處世中一直身體力行:友善隨和且心比赤子,不耍投機(jī)取巧的“小聰明”;寬容大度但堅(jiān)持原則,不做隨波逐流的“老好人”。淡泊寧?kù)o,不在雙邊關(guān)系中追逐強(qiáng)勢(shì);嚴(yán)守初心,能夠抗拒嫉賢妒能的誘惑。這些信條本來(lái)就是生活中常見的為人處世之道,但是能夠用博弈論模型加以總結(jié),形成指導(dǎo)實(shí)踐的科學(xué)結(jié)論,并且把這些信條連接起來(lái),作為一種整體性的策略組合來(lái)行事,讓我覺得自己與眾不同。
這套策略的核心理念就是去跟盡可能多的人廣結(jié)善緣,開展友好的互動(dòng),形成持久的互惠關(guān)系,并且發(fā)展出信任和友誼,當(dāng)然它背后的動(dòng)機(jī)仍然是自私,仍然是為了個(gè)體生活得更好。人跟人之間是如此,國(guó)與國(guó)之間也差不多,只不過(guò)人際交往之間有比較多的倫理和道德因素,但國(guó)家間關(guān)系自古以來(lái)就是叢林色彩更多一些,權(quán)力和利益關(guān)系更加赤裸裸一些。
多邊主義的踐行者
近年來(lái)美國(guó)的對(duì)外政策,尤其是對(duì)華政策文件中經(jīng)常用一個(gè)英文詞“reciprocity”,翻譯成漢語(yǔ)是“互惠”,這其實(shí)是不夠準(zhǔn)確的,“reciprocity”其實(shí)還有“報(bào)復(fù)”的意思,我覺得一個(gè)更合適的翻譯是“回報(bào)”,就是要對(duì)別人的各種行為進(jìn)行質(zhì)和量?jī)蓚€(gè)方面都相稱的反應(yīng),其中就包含了“以牙還牙”的思想。
現(xiàn)實(shí)中以牙還牙策略的運(yùn)用比計(jì)算機(jī)程序的博弈競(jìng)賽當(dāng)然要復(fù)雜得多,比如現(xiàn)實(shí)中的朋友關(guān)系并不總是合作雙贏的,某些關(guān)系是典型的高成本低回報(bào),原因往往在于對(duì)方和自己在能力上的不對(duì)稱;比如面對(duì)資源的硬約束,現(xiàn)實(shí)中總是無(wú)法有足夠的資源來(lái)維持對(duì)別人的各種回報(bào),尤其是當(dāng)你擁有很多朋友的時(shí)候;比如如何做到回報(bào)相稱,你覺得這種回報(bào)是一種相稱的警告,但是你的朋友可能會(huì)認(rèn)為你反應(yīng)過(guò)度;再比如回報(bào)的內(nèi)生問(wèn)題,假如雙方都采取以牙還牙策略,一旦由于誤解進(jìn)入了相互懲罰的惡性循環(huán),就幾乎永無(wú)解脫。
針對(duì)上述問(wèn)題,我進(jìn)行了相應(yīng)的策略調(diào)整,其中一個(gè)重要的調(diào)整就是重視利用圈子來(lái)解決問(wèn)題。雙邊關(guān)系中的回報(bào)一旦放進(jìn)了多邊關(guān)系中操作,不少問(wèn)題就得以迎刃而解。得罪一個(gè)人可能并不會(huì)帶來(lái)對(duì)社會(huì)關(guān)系的巨大損害,但是假如得罪某人意味著與一群人為敵,背叛的成本就非常高了,比如我就非常樂意把我的新朋友介紹給老朋友們認(rèn)識(shí),這就相當(dāng)于用一張關(guān)系網(wǎng)分擔(dān)了背叛行為對(duì)脆弱友情的沖擊力。同樣的原理可以用在國(guó)與國(guó)之間的關(guān)系中,多邊主義外交就是一個(gè)不錯(cuò)的選擇,一個(gè)小國(guó)可能無(wú)法有效地報(bào)復(fù)大國(guó)對(duì)它的背叛,但是如果大家都處于同一個(gè)多邊體系里,一旦體系內(nèi)大國(guó)對(duì)某小國(guó)進(jìn)行了背叛,它就會(huì)信用受損,使它受到失去整個(gè)圈子的巨大潛在損失。而且一個(gè)大國(guó)越是積極地利用自己的信用和威望,別的國(guó)家就越敢相信它;反過(guò)來(lái)如果一個(gè)國(guó)家不太愛明確地承諾權(quán)利與義務(wù),別的國(guó)家也無(wú)法相信它,就如同你若從來(lái)沒有用過(guò)信用卡里的錢,那么信用卡的透支額度就非常小。
在任何一個(gè)雙邊關(guān)系中,中國(guó)人都是講究禮讓、大度、謙虛的,與此同時(shí)我們又堅(jiān)決捍衛(wèi)根本利益與整體原則,達(dá)成了剛與柔的平衡,正因如此,盡管中國(guó)跟世界上大多數(shù)國(guó)家存在政治制度和意識(shí)形態(tài)的差異,但是仍然能夠做到朋友遍天下,成為全球七成國(guó)家的最大貿(mào)易伙伴。相反,特朗普?qǐng)?zhí)政美國(guó)的4年里犯了類似的錯(cuò)誤,試圖在每一個(gè)雙邊關(guān)系中都占上風(fēng),這種操盤模式導(dǎo)致美國(guó)處處樹敵,國(guó)際地位、威望明顯下滑。
本文摘自中國(guó)人民大學(xué)國(guó)際關(guān)系學(xué)院副院長(zhǎng)翟東升的新作《平行與競(jìng)爭(zhēng)》。
《平行與競(jìng)爭(zhēng):雙循環(huán)時(shí)代的中國(guó)治理》,翟東升/著,東方出版社,2021年7月版