公元219年發(fā)生的襄樊之戰(zhàn),以蜀漢劉備部將關(guān)羽北伐曹魏,水淹七軍、圍困襄、樊兩城開端,以東吳孫權(quán)部將呂蒙“白衣渡江”偷襲南郡,關(guān)羽敗走麥城,身首異處結(jié)束。
這是一次典型的囚徒困境。
赤壁之戰(zhàn)前,劉備與孫權(quán)結(jié)成聯(lián)盟,約定共同對(duì)抗北方最強(qiáng)大的曹操,以獲得合作收益。關(guān)羽北伐是針對(duì)曹操的軍事行為,可以理解為劉備一方努力履行聯(lián)盟的合作契約,執(zhí)行合作策略。孫權(quán)一方趁劉備一方正努力執(zhí)行合作策略,趁其毫無防范之機(jī),偷襲了關(guān)羽的后方根據(jù)地,導(dǎo)致關(guān)羽兵敗身死。孫權(quán)一方的偷襲不是針對(duì)曹操的軍事行為,而是針對(duì)劉備的軍事行為,是典型的執(zhí)行了背叛策略。
(“,”左側(cè)數(shù)值為劉備的收益,右側(cè)數(shù)值為孫權(quán)的收益)
在單次的囚徒困境博弈模型中,若博弈雙方同時(shí)選擇合作,則各獲得2收益;同時(shí)選擇背叛,則各獲得0收益;一方選擇合作另一方選擇背叛,合作方收益-1,背叛方收益3。同時(shí)選擇合作能讓集體獲得最高收益,2+2=4。但是當(dāng)一方選擇合作給定時(shí),另一方選擇合作收益2,選擇背叛收益3,2<3,對(duì)集體中的個(gè)體來說,當(dāng)對(duì)方會(huì)選擇合作時(shí),其最佳策略是選擇背叛。同時(shí)選擇合作策略,對(duì)集體來說雖然是收益最高的策略,但對(duì)個(gè)體來說并不是——損害同伴的利益才能最大化自身利益。當(dāng)一方努力履行合作契約時(shí),另一方有很強(qiáng)的激勵(lì)不履行合作契約,而是采取背叛策略。
作為孫權(quán)一方來說,當(dāng)劉備一方努力履行合作契約時(shí),其執(zhí)行背叛的策略,的的確確能夠獲得最高收益——這從呂蒙能夠輕而易舉拿下南郡就可以證明——成本低、收益高。如果只考慮襄樊之戰(zhàn)這一單次博弈,而不考慮未來,孫權(quán)偷襲南郡能得到最大收益,是最佳策略。
在單次的囚徒困境博弈模型中,實(shí)際上,無論對(duì)方選什么,選擇背叛永遠(yuǎn)是最佳策略。上面我們已經(jīng)分析了一方選擇合作策略給定時(shí),另一方的最佳策略是背叛。若一方選擇背叛給定,則另一方選擇合作收益-1,選擇背叛收益0,-1<0,最佳策略依然是選擇背叛。
作為劉備一方來說,似乎根本不該考慮履行合作契約,任何合作的舉動(dòng)都是劣選策略,只會(huì)降低自己的收益。關(guān)羽的北伐是愚蠢的,把劉備一方推到了一個(gè)注定大敗虧輸?shù)木车亍獙O權(quán)若選擇背叛,劉備選擇合作的收益是最低的-1。
我見過很多夸贊孫權(quán)的偷襲多么明智,而諷刺關(guān)羽的北伐是多么愚蠢的言論。這些言論,包括我之前的分析,全部!都錯(cuò)!錯(cuò)!錯(cuò)!
真正出了昏招的孫權(quán)!
為什么?
因?yàn)橐陨衔覀兎治龅氖菃未吻敉嚼Ь巢┺模∷^單次博弈,就是說博弈參與者在這次博弈之后就老死不相往來了,你遇不到我,我也找不到你,不會(huì)有下一次博弈了。但現(xiàn)實(shí)情況是,劉備就在西川,孫權(quán)就在江東,你能找到我,我想見你也很容易,今天這次博弈結(jié)束之后,明天還要接著博弈,并且不知道今后還有多少場(chǎng)博弈。
這種情況叫做無限次數(shù)重復(fù)博弈。
單次博弈與無限次數(shù)重復(fù)博弈有什么區(qū)別?后者是要考慮未來的,前者卻不需要考慮。
未來會(huì)發(fā)生什么?
未來會(huì)發(fā)生收益!
這時(shí)一個(gè)新策略出現(xiàn)了,叫做“報(bào)復(fù)”。所謂報(bào)復(fù),就是在上一局博弈中,甲方遭遇乙方背叛,那么在下一輪博弈中,甲方也要對(duì)乙方采用背叛策略。報(bào)復(fù)雖然針對(duì)的是過去的行為,目的卻是為了獲取更多的未來收益。
(“,”左側(cè)數(shù)值為劉備的收益,右側(cè)數(shù)值為孫權(quán)的收益)
在一個(gè)共有N輪博弈的重復(fù)博弈中,給定甲遭遇背叛就會(huì)在下一輪實(shí)施報(bào)復(fù),不遭遇背叛就會(huì)一直合作。第n輪甲合作,乙背叛了,乙收益3;在第n+1輪,甲報(bào)復(fù)乙,選擇背叛,乙無論如何選擇,收益最高為0;兩輪收益相加總和為3+0=3。第n輪甲合作,乙也選擇合作,乙收益2;由于甲沒有遭到背叛,所以第n+1輪甲會(huì)選合作,乙也選合作,收益2,;兩輪收益相加總和為2+2=4。乙背叛甲的兩輪收益總和為3,乙一直與甲合作兩輪收益總和為4,3<4,因此比起背叛,乙更愿意跟甲合作。
現(xiàn)在給定甲永遠(yuǎn)不會(huì)實(shí)施報(bào)復(fù),即,無論在第n輪乙采用什么策略,甲在第n+1輪依舊會(huì)選合作。第n輪,甲合作,乙合作,乙收益2;第二輪甲合作,乙合作,乙收益2;兩輪相加,乙總共收益4。第n輪甲合作,乙背叛,乙收益3;第n+1輪甲合作,乙背叛,乙收益3;乙兩輪收益相加總和為6。4<6,跟兩輪合作相比,兩輪背叛收益更高。實(shí)際上,我們還可以組成其他的策略組合,但是,只要甲永遠(yuǎn)選擇合作,乙永遠(yuǎn)選擇背叛所得的收益一定是最高的。因此,在甲不會(huì)報(bào)復(fù)的情況下,乙最佳選擇永遠(yuǎn)是背叛,甲就永遠(yuǎn)無法得到合作收益。=
報(bào)復(fù)提高了背叛者的背叛成本,使背叛的收益小于合作,從而激勵(lì)了人們履行合作契約。報(bào)復(fù)讓自己更安全。當(dāng)乙認(rèn)為甲會(huì)對(duì)背叛行為進(jìn)行報(bào)復(fù)的可能性越高的時(shí)候,就越不愿意背叛甲,反之,乙認(rèn)為甲會(huì)對(duì)背叛行為進(jìn)行報(bào)復(fù)的可能性越低,就越愿意背叛甲。
乙如何判斷甲對(duì)背叛行為的進(jìn)行報(bào)復(fù)的可能性?看他曾經(jīng)報(bào)復(fù)的頻率!曾經(jīng)實(shí)施報(bào)復(fù)的頻率越高,就說明未來會(huì)實(shí)施報(bào)復(fù)的概率也就越高;曾經(jīng)實(shí)施報(bào)復(fù)的頻率越低,就說明未來會(huì)實(shí)施報(bào)復(fù)的概率也就越低。
甲每一次的報(bào)復(fù)或不報(bào)復(fù)的決定,都關(guān)系著未來博弈中遭遇背叛的可能性。對(duì)這一次背叛行為實(shí)施了報(bào)復(fù),在未來遭遇背叛的可能性就越低,未來合作收益也就越高;不對(duì)這一次背叛行為實(shí)施報(bào)復(fù),在未來遭遇背叛的可能性就越高,未來合作收益也就越低。
為了降低未來博弈中博弈對(duì)手的背叛激勵(lì),獲得盡可能多的未來收益,一定要盡可能對(duì)每一次背叛行為進(jìn)行報(bào)復(fù)!
當(dāng)孫權(quán)派呂蒙趁虛而入,占領(lǐng)南郡,導(dǎo)致關(guān)羽身死時(shí),他就應(yīng)該料想到,劉備絕不會(huì)善罷甘休,因?yàn)閷?duì)背叛行為進(jìn)行報(bào)復(fù)關(guān)系到未來。但孫權(quán)似乎并沒有想到,最起碼沒有想到劉備實(shí)施報(bào)復(fù)的嚴(yán)重性。
公元221年,劉備親自率領(lǐng)5萬大軍討伐孫權(quán),發(fā)動(dòng)了夷陵之戰(zhàn)。這一場(chǎng)戰(zhàn)役,孫權(quán)部將陸遜“火燒連營”,打得劉備幾乎全軍覆沒——孫權(quán)贏了。
有什么嚴(yán)重后果?
孫權(quán)與劉備能夠結(jié)成聯(lián)盟,合作對(duì)抗曹操,是因?yàn)闊o論是孫權(quán)還是劉備,其能力都不足以完成獨(dú)自對(duì)抗曹操的目標(biāo),合作能讓雙方獲得比單干更高的收益。只要孫權(quán)和劉備無法單獨(dú)對(duì)抗曹操這一現(xiàn)實(shí)不變,雙方合作獲得的收益就會(huì)大于單干獲得的收益。這個(gè)博弈的期限是“無限”的——不知道在未來的什么時(shí)候會(huì)結(jié)束。這也就意味著,這個(gè)未來可能很長(zhǎng)(從實(shí)際情況看,這個(gè)未來確實(shí)很長(zhǎng)),未來越長(zhǎng),雙方就可以從未來的合作中獲得越豐厚的回報(bào)。
合作雙方的能力越強(qiáng),大概率來說,合作收益就會(huì)越高。如果一方的能力受到削弱,不僅僅影響到這一方的收益,還會(huì)讓另一方的合作收益也減少。
呂蒙“白衣渡江”之前,劉備定軍山之戰(zhàn)斬殺夏侯淵,從曹操手中奪取漢中;襄樊之戰(zhàn),關(guān)羽水淹七軍,斬殺龐德,生擒于禁,圍困襄陽、樊城,逼得曹操考慮遷都以避鋒芒。這些軍事行動(dòng)給曹操帶來了嚴(yán)重的、真實(shí)的威脅,曹操必然需要增加力量對(duì)來應(yīng)對(duì)劉備一方的行動(dòng)。對(duì)劉備一方增加力量,就意味著沒有更多力量應(yīng)對(duì)孫權(quán)一方,即使孫權(quán)無力發(fā)起對(duì)曹操的進(jìn)攻,自身的防御壓力總歸會(huì)減少,這就提高了孫權(quán)一方的收益。
夷陵之戰(zhàn)中劉備損失慘重,導(dǎo)致蜀漢被削弱。蜀漢的衰弱,使曹操可以減少針對(duì)蜀漢的力量,將這些力量投入到針對(duì)東吳一方。蜀漢的削弱,不僅僅降低了蜀漢獲取收益的能力,同時(shí)也降低了東吳獲取收益的能力。
每一輪博弈的合作收益都降低了,那么未來博弈的輪次越多,也就是未來越長(zhǎng),損失的收益也就越多。
看似襄樊之戰(zhàn)和夷陵之戰(zhàn)孫權(quán)都是最后的勝利者,但實(shí)際上孫權(quán)一方為了眼前的收益,放棄了許許多多未來收益?!鞍滓露山敝?,孫劉聯(lián)盟給曹魏的帶來了巨大壓力,但是在“白衣渡江”之后,這一聯(lián)盟再也沒能對(duì)曹魏集團(tuán)形成實(shí)質(zhì)性的威脅,只是勉強(qiáng)維持不被消滅而已。
那什么時(shí)候應(yīng)該選擇背叛呢?很明顯,沒有未來的時(shí)候!越是沒有未來,就越要背叛,奪取盡量多的眼前收益。比如說曹魏眼看就要被嚴(yán)重削弱了,對(duì)抗他不需要與劉備結(jié)盟了,這時(shí)候在孫權(quán)看來,孫劉聯(lián)盟的未來大概率就要結(jié)束了,沒有那么多未來收益可以獲得了,眼前收益大于未來收益,就應(yīng)該準(zhǔn)備采取背叛策略。
我們引入貼現(xiàn)率P。明天得到2收益,不如立刻得到2收益值錢,因?yàn)槊魈鞎?huì)出現(xiàn)很多意外導(dǎo)致你無法得到這2收益,貼現(xiàn)率就是明天依舊會(huì)得到2收益的概率,也可以理解成明天的2收益比幾天的2收益貶值的比率。
若第n輪甲方遭遇乙方背叛,在以后的博弈中,甲就再也不會(huì)與乙方合作,則乙方的收益為第n輪背叛的收益3,加以后的無窮個(gè)0,最終為3。乙一直與甲合作的收益是第n輪的收益2,加上n+1輪的收益2P,加上n+2輪的收益2P²,加上n+3輪的收益2P³……就是無窮多個(gè)2相加。若乙該背叛甲,說明背叛收益高于一直合作的收益,則3>2+2P+2P²+2P³……,求得P小于1/3時(shí),滿足不等式。當(dāng)下一輪博弈依舊會(huì)繼續(xù)的概率不小于1/3時(shí),乙背叛甲的收益就小于一直與甲合作的收益,乙就不該背叛;只有預(yù)期博弈繼續(xù)的概率小于1/3時(shí),乙背叛甲的收益才會(huì)大于繼續(xù)與甲合作,乙應(yīng)該背叛甲。
背叛或者合作,與貼現(xiàn)率的大小有關(guān)!
這就是為什么說孫權(quán)趁機(jī)奪取南郡是一個(gè)愚蠢的短視行為,因?yàn)樵诋?dāng)時(shí)的情況看來,曹魏集團(tuán)會(huì)在很長(zhǎng)一段時(shí)間里保持最強(qiáng)者地位,這就說明孫劉聯(lián)盟合作的貼現(xiàn)率是比較大的,而貼現(xiàn)率大時(shí),選擇合作才是收益最高的策略。
夷陵之戰(zhàn)之后,諸葛亮主持了蜀漢與東吳的重新談判,再一次讓雙方回到了合作的策略上,為什么蜀漢會(huì)愿意重新與東吳合作呢?理由是——預(yù)期的貼現(xiàn)率特別大。
第n輪甲遭遇乙背叛,乙收益3,n+1輪甲報(bào)復(fù)乙,選擇背叛,乙收益0,n+2輪甲乙重新合作,乙收益2P²,n+3輪收益2P³……乙一直與甲合作,第n輪收益2,n+1輪收益2P,n+2輪收益2P²,n+3輪收益2P³……滿足背叛收益小于合作,則滿足3≤2+2P,求得P≥1/2。
當(dāng)貼現(xiàn)率足夠大時(shí),在一輪背叛與一輪報(bào)復(fù)后,乙與甲合作的未來收益依舊足夠大,乙沒有繼續(xù)背叛的激勵(lì),因此甲在報(bào)復(fù)后,與乙繼續(xù)合作可以獲得更多收益。
因?yàn)槭駶h和東吳都承認(rèn)貼現(xiàn)率確實(shí)是比較大的,也就是說,雙方合作才能對(duì)抗曹魏的現(xiàn)實(shí)會(huì)延續(xù)很長(zhǎng)時(shí)間,所以雙方才愿意重新達(dá)成合作關(guān)系。
劉備發(fā)動(dòng)夷陵之戰(zhàn)是對(duì)的,因?yàn)閳?bào)復(fù)是必須的;諸葛亮在夷陵之戰(zhàn)后重新與東吳結(jié)成聯(lián)盟也是對(duì)的,因?yàn)樾枰c東吳合作才能對(duì)抗曹魏;但是孫權(quán)在關(guān)羽北伐曹操的時(shí)候偷襲南郡卻是錯(cuò)的,在貼現(xiàn)率明顯很高的情況下采用了背叛策略,是為了眼前的蠅頭小利放棄了巨大的未來收益,是非常不明智的。
這是可以用數(shù)理證明的。
孫劉聯(lián)盟的頹勢(shì)看起來是從夷陵之戰(zhàn)開始的,實(shí)際上在呂蒙“白衣渡江”之時(shí),歷史的天平已經(jīng)開始傾斜了。劉備死后,諸葛亮主持了蜀漢與東吳的重新談判,又達(dá)成了合作關(guān)系,但是,勢(shì)已成,不可逆,結(jié)局已經(jīng)寫就,回天乏力了。
作者:第五大洋,歷史百家爭(zhēng)鳴特約作者