版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

關(guān)于博弈的基本常識

北京理工大學(xué)
原創(chuàng)
北京理工大學(xué)官方科普號,i北理愛科學(xué)
收藏

關(guān)于博弈的基本常識

王杰衛(wèi)

一、博弈的分類

博弈可根據(jù)不同的分類方式進行劃分,例如根據(jù)參與者的行動順序、對其他參與者的了解程度以及是否存在合作關(guān)系等進行分類。

1、按照參與者出招的順序、博弈持續(xù)時間和重復(fù)次數(shù)的角度,博弈可分為靜態(tài)博弈(Static Game)和動態(tài)博弈(Dynamic Game)。 靜態(tài)博弈指的是各方同時采取策略,而各方的收益則取決于不同的策略組合。因此靜態(tài)博弈也被稱為“同時行動的博弈”(Simultaneous-Move Games)。盡管有時博弈方采取策略有先后之分,但他們并不了解之前其他人所做出的策略。比如在“囚徒困境”中,當罪犯1做出策略后,輪到罪犯2時他并不知道罪犯1所做出的策略。 動態(tài)博弈(序貫博弈)指的是參與博弈的方在選擇策略時有先后順序,且能夠了解先行動者所選擇的策略。

2、從博弈者對其他參與者了解的程度方面,博弈可分為完全信息博弈(Complete Information Game)與不完全信息博弈(Incomplete Information Game),以及完美信息博弈(Perfect Information Game)與不完美信息博弈(Imperfect Information Game),確定的博弈(Certainty Game)與不確定的博弈(Uncertain Game),對稱信息博弈(Symmetric Game)與非對稱信息博弈(Asymmetric Game)等。 完全信息博弈指的是每個博弈者對其他博弈者的特征、策略空間和收益函數(shù)都了解,即所有博弈者都知道博弈者的收益集(Pay offs)。完美信息則指的是博弈者在采取策略時完全知曉其他博弈者的所有策略信息。完美信息涉及到記憶,即博弈者了解博弈過程中的所有信息。如果博弈者在采取策略時觀察到的信息節(jié)點是唯一的,則表示他對過去信息有完美的記憶;否則,他對之前信息的記憶不完美。因此,完全信息不一定意味著完美信息,而不完全信息則一定不是完美的。 不完全信息博弈指的是某些博弈者對其他博弈者的特征、策略空間和收益函數(shù)了解不夠全面,或者說并非所有博弈者對這些信息了解充分。在不完全信息博弈中,首先行動的是自然(Nature),自然決定博弈者以何種可能性采取某種策略,而這種可能性只有自然本身知道。確定的博弈則是指不存在由自然做出這種行動的博弈,否則就是不確定的博弈。

3、從博弈者之間是否存在合作關(guān)系的角度來看,博弈可分為合作博弈(Cooperative Game)和非合作博弈(Non-Cooperative Game)。 合作博弈指的是博弈者之間有一定程度的合作協(xié)議,他們需要在協(xié)議允許的范圍內(nèi)進行博弈。例如,兩家企業(yè)可能通過談判達成協(xié)議,約定各自的產(chǎn)量或價格,以達到共同壟斷市場的目的。相反,如果博弈者無法通過談判達成具有約束力的協(xié)議以限制彼此的策略選擇,則這種情況被稱為非合作博弈。 非合作博弈可以進一步細分為:完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動態(tài)博弈。對應(yīng)于這些情況的有四種均衡:納什均衡(Nash Equilibrium)、子博弈精煉納什均衡(Subgame Perfect Nash Equilibrium)、貝葉斯納什均衡(Bayesian Nash Equilibrium)、精煉貝葉斯納什均衡(Perfect Bayesian Nash Equilibrium)。

|| ||

4、根據(jù)博弈者的收益情況,博弈可以被歸類為零和博弈(Zero-Sum Game)與非零和博弈(Non-Zero-Sum Game),以及常和博弈(Constant-Sum Game)與變和博弈(Variable-Sum Game)。零和博弈已經(jīng)在先前有所介紹,而非零和博弈指涉的是博弈各方的總收益不為零。常和博弈是指各方的總收益始終保持常數(shù),而變和博弈則是指各方的總收益并非固定不變。

二、博弈中的參與方(博弈方)

1、單人博弈

單人博弈僅涉及一方參與者,可視為一般優(yōu)化問題。在這種情況下,博弈者在給定條件下選擇何種策略以最大化自身收益,而不考慮其他博弈方的影響。單人博弈的分析有助于理解更為復(fù)雜的多人博弈。

2、雙人博弈

雙人博弈由兩方構(gòu)成,例如兩人玩猜硬幣、囚徒困境等,這類博弈最為普遍。

3、多人博弈

在多人博弈中,參與者達三人或三人以上。每個博弈方獨立做出決策,需要在其他博弈者做出反應(yīng)的情況下找到使自身收益最大化的策略。雖然多人博弈與雙人博弈相似,但其復(fù)雜性更高,可能存在“破壞者”,其策略選擇對自身利益無影響,但對其他博弈者的收益產(chǎn)生影響。

三、博弈中的策略(Strategies)

在博弈中,每個博弈者根據(jù)情況做出的決策被稱為“策略”,博弈者可選擇的所有策略構(gòu)成“策略空間”。該空間可以是離散或連續(xù)的。如果博弈者可選擇的策略是可數(shù)的,例如在“囚徒困境”中,每個博弈者只有“坦白”和“不坦白”兩種策略,這被稱為“有限次博弈”,可用收益矩陣、擴展形式等方法表示;如果博弈者可選擇的策略是不可數(shù)的,例如古諾模型中的連續(xù)模型,每個工廠可有無數(shù)種策略,這被稱為“無限次博弈”,通常以數(shù)集或函數(shù)形式表示。

四、博弈中的收益(Payoffs)

博弈中的收益是博弈者從中獲得的利益,類型多種多樣,例如收入、利潤、時間或情緒價值等。一般來說,有限次博弈的收益可用收益矩陣表示,而無限次博弈的收益可用收益函數(shù)表示。

五、博弈的過程

博弈過程可包含先后、反復(fù)或重復(fù)的策略對抗。根據(jù)博弈過程,可分為“靜態(tài)博弈”、“動態(tài)博弈”和“重復(fù)博弈”。

1、靜態(tài)博弈(Static Games)

靜態(tài)博弈要求所有參與者同時做出決策。即使決策時間不同,但在做出決策之前,參與者不知道其他博弈者的選擇,且在了解其他博弈者決策后也不能改變自身策略。

2、動態(tài)博弈(Dynamic Games)

動態(tài)博弈中,博弈方的決策有先后順序。后決策者在做出決策之前可以看到前面博弈者的選擇,甚至包括自己的決策。動態(tài)博弈也稱為“多階段博弈”。

3、重復(fù)博弈(Repeated Games)

重復(fù)博弈是指同一博弈進行多次。構(gòu)成重復(fù)博弈的一次性博弈也稱為“原博弈”或“階段博弈”。大多數(shù)重復(fù)博弈的原博弈是靜態(tài)博弈,或由靜態(tài)博弈構(gòu)成的。重復(fù)博弈的最少重復(fù)次數(shù)為兩次,有的重復(fù)博弈會進行有限次數(shù),如體育競技中的多局制比賽,也有的進行無限次數(shù),如市場中企業(yè)的競爭。重復(fù)博弈的每次博弈之間存在相互影響和制約,無法將其分解為獨立的博弈進行分析。

評論
陳 光 輝
少師級
博弈過程可包含先后、反復(fù)或重復(fù)的策略對抗。根據(jù)博弈過程,可分為“靜態(tài)博弈”、“動態(tài)博弈”和“重復(fù)博弈”。
2024-06-28