前面已經(jīng)指出,博弈論研究的對象是理性的行動者或參與人面對他人,如何選擇策略或如何作出行動的決定的。理性的人是對現(xiàn)實的人的抽象,理性的人是指能夠進行推理的人,而博弈中的理性的人是指能夠運用推理能力使自己的目標最大化的人?!袄硇缘摹迸c“道德的”不是一回事,理性的與道德的有時會發(fā)生沖突,但是理性的人不一定是不道德的。我們在后面的章節(jié)中將闡述理性的人怎么會產(chǎn)生道德的行為。
博弈涉及哪些內(nèi)容呢?
第一, 一個博弈涉及至少兩個獨立的博弈參與人(player)。
一個博弈是一個活動,該活動至少有兩個參與人,下文有時將參與人稱為行動者。每個參與人通過行動,努力使自己的效用或利益最大化。但是,他的行動的好處或支付取決于另外的參與人。
“囚徒博弈”或“囚徒困境”是一個被廣泛談及和研究的博弈。兩個共同作案偷竊的小偷被警察抓住,被帶進警察局單獨關(guān)押。他們面臨的“政策”是“坦白從寬,抗拒從嚴”,具體的政策是:如果一方與警方合作,招認并供出自己與對方以前所做違法之事,而對方不招認,招認方無罪釋放,不招認的另一方則會被判重刑10年;如果雙方都與警方合作共同招認,各被判刑5年;而如果雙方均不承認有罪,因警察找不到他們以前違法的證據(jù),只能對他們的小偷行為進行懲戒,各被判刑3個月。這兩個小偷如何作出選擇?
在這個囚徒困境中,參與人為兩個小偷。每個小偷的最后結(jié)果——是當(dāng)場釋放還是被判刑(10年、5年、3個月),不僅取決于他自己的決定,而且還取決于另外一個小偷的決定。
買賣活動是日常生活中的常見現(xiàn)象。我們知道,在買賣的交換行為中,買東西的人要盡量以低的價格買到,但是他是否能買到取決于賣者是否能賣;賣東西的人想以盡量高的價格將東西賣出去,但價格太高,買者不接受,因此賣東西的人能否將物品賣出去取決于買者。
囚徒困境是一個博弈,買賣的交易活動也是博弈。我們可看到,在任何一個博弈之中,至少存在兩個理性的參與人,他們的利益是相關(guān)的,即他們每個人的利益受其他人的行動影響。
第二, 博弈中行動者或參與人存在策略(strategy)選擇的可能。
博弈論用策略空間來表示參與人可以選擇的策略集。
赤壁一戰(zhàn),曹兵大敗,曹操落荒而逃,在選擇是走通往華容道的小路,還是選擇大路時,曹操需要在兩個策略之間進行選擇:“走大路”還是“走小路”。曹操最終選擇“走小路”。囚徒困境中的小偷面臨著“不招認”還是“招認”的選擇。
不同策略下的后果往往是有差異的,否則便不存在選擇的必要。對每個參與人而言,如果沒有不同選擇的可能,理性的計算便是多余的,對自己的目標也就無能為力。從這個意義上來講,我國改革開放走向市場經(jīng)濟,就是使得每個經(jīng)濟主體有選擇的可能,這樣人們才能發(fā)揮其理性的作用,使每個人的經(jīng)濟狀況更好,而在計劃經(jīng)濟下因沒有可選擇的余地,每個人的理性計算能力便無從施展。
第三,參與人在不同策略組合下會得到一定的支付(payoff)。
我們往往用支付矩陣來表示參與人在各種策略組合下的支付。 這個方法簡單,比用函數(shù)來表示直觀、易于理解,當(dāng)然它的缺陷是,它只能表示兩個人的博弈結(jié)構(gòu)。囚徒困境的支付矩陣為:
甲
乙 不招認 招認
不招認 各被判刑3個月 甲:當(dāng)場釋放
乙:被判刑10年,
招認 甲:被判刑10年
乙:當(dāng)場釋放 各被判刑5年
這個矩陣表示的是:若甲選擇“招認”、乙選擇“招認”,甲乙各被判刑5年;若甲選擇“招認”、乙選擇“不招認”,甲被當(dāng)場釋放,乙被判刑10年;若甲選擇“不招認”、乙選擇“招認”,甲被判刑10年,乙被當(dāng)場釋放;若甲選擇“不招認”、乙選擇“不招認”,甲乙均被判刑3個月。
我們再來刻畫一交易過程的支付矩陣。在賣主甲和買主乙之間的“買-賣”博弈中——這是一討價還價過程,通過討價還價后一個價格被確定。在此價格下我們假定,賣者賣成后獲得的效用為6,賣不成的效用為0;買者買成的效用為4,買不成的效用為0。而如果他們之間的交易不成功,無論是買主還是賣主都要等待并再次進行討價還價,這需要成本。假定等待和討價還價的成本均為1,則支付矩陣為:
乙
甲 買成 買不成
賣成 6,4 5,0
賣不成 0,3 0,0
這兩個矩陣表明,在每個策略組合下參與人有一個收益值或支付值。