微觀經(jīng)濟(jì)學(xué)高鴻業(yè)第十章博弈論初步ppt課件
《微觀經(jīng)濟(jì)學(xué)高鴻業(yè)第十章博弈論初步ppt課件》由會員分享,可在線閱讀,更多相關(guān)《微觀經(jīng)濟(jì)學(xué)高鴻業(yè)第十章博弈論初步ppt課件(35頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第十章 博弈論初步,一、博弈論和策略行為 二、同時博弈:純策略均衡 三、同時博弈:混合策略均衡 四、序貫博弈 五、其他的經(jīng)典博弈案例,Neumann 1903--1957,西方經(jīng)濟(jì)學(xué)·微觀·第7章 1,一、博弈論和策略行為,1.博弈論的產(chǎn)生與含義 :博弈論在20世紀(jì)50年代由數(shù)學(xué)家約翰·馮·諾依曼(Von Neumann)和經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯坦(Morgenstern)引入經(jīng)濟(jì)學(xué),目前已經(jīng)成為主流經(jīng)濟(jì)分析的主要工具,對寡頭理論、信息經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)理論的發(fā)展作出了重要貢獻(xiàn)。 博弈論是研究在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行動的科學(xué)。在策略性環(huán)境中,每一個人進(jìn)行的決策和采取的行動都會對其他人產(chǎn)生影響。因此,每個人在進(jìn)行策略性決策和采取策略性行動時,要根據(jù)其他人的可能反應(yīng)來決定自己的決策和行動。,2.幾個基本概念,(1)博弈參與人 參與人或稱局中人,是指博弈中的決策主體,即在博弈中進(jìn)行決策的個體。參與人既可以是個人,也可以是團(tuán)體(企業(yè)或國家)。每個參與人的目標(biāo)是通過選擇行動使自己的效用最大化。,(2)策略 策略是指參與人選擇行為的規(guī)則,也就是指參與人應(yīng)該在什么條件下選擇什么樣的行動,以保證自身利益最大化。,(3)支付,更多的稱為“得益” 支付指在所有參與人都選擇了各自的策略且博弈已經(jīng)完成之后,參與人獲得的效用(或期望效用)。,(4)支付矩陣 參與博弈的多個參與人的收益可以用一個矩陣或框圖表示,這樣的矩陣或框圖稱之為支付矩陣,也稱之為博弈矩陣或收益矩陣。博弈參與人、參與人的策略和參與人的支付構(gòu)成了博弈須具有的三個基本要素。,二、同時博弈:純策略均衡,1.支付矩陣——寡頭博弈舉例,表 10-1 寡頭博弈:合作與不合作,二、同時博弈:純策略均衡,2.同時博弈 “同時博弈”是參與人同時進(jìn)行決策或行動的博弈。在同時博弈中,在給定其他參與人的策略時,某個參與人的最優(yōu)策略稱之為該參與人的條件優(yōu)勢策略(簡稱條件策略),而包括該參與人的條件策略以及這些條件在內(nèi)的所有參與人的策略組合稱之為該參與人的條件優(yōu)勢策略組合(簡稱條件策略組合)。,3.占優(yōu)策略 在一些特殊的博弈中,一個參與人的最優(yōu)策略可能并不依賴于其他人的選擇。也就是說,無論其他參與人采取什么策略,該參與人的最優(yōu)策略是惟一的,這樣的策略稱之為占優(yōu)策略。如表10-2所示,通過對支付矩陣的分析可以看出,如果A、B兩廠商都是理性的,則這個博弈的結(jié)果是兩廠商都做廣告,即不管一個廠商如何決定,另外一個廠商都會選擇做廣告。這種策略均衡稱之為占優(yōu)策略均衡(equilibrium in dominant strategies)。,二、同時博弈:純策略均衡,4.納什均衡 并不是每個博弈的各個參與人都有一個占優(yōu)策略。如表10-3所示,通過對支付矩陣的分析可以看出,現(xiàn)在廠商A沒有占優(yōu)策略,它的最優(yōu)決策取決于廠商B的選擇。如果廠商B做廣告,則廠商A最好也做廣告;但如果廠商B不做廣告,廠商A不做廣告又是最好的選擇。這種均衡就是納什均衡(Nash equilibrium)。所謂納什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處。即如果在一個策略組合中,當(dāng)所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略組合就是一個納什均衡。,表10-2 廣告博弈的支付矩陣,表10-3 廣告博弈的支付矩陣,二、同時博弈:純策略均衡,5.納什均衡與占優(yōu)均衡的區(qū)別與聯(lián)系 每一個占優(yōu)策略均衡一定是納什均衡,但并非每一個納什均衡都是占優(yōu)策略均衡。納什均衡是有條件的占優(yōu)策略均衡。 一個博弈可能存在一個以上的納什均衡,但是一個博弈也可能不存在純策略納什均衡,如表10-4所示。,表10-4 沒有納什均衡的同時博弈,例10.1說法錯誤的是( )。 A.占優(yōu)策略均衡一定是納什均衡 B.納什均衡不一定是占優(yōu)策略均衡 C.占優(yōu)策略均衡中,每個參與者都是在針對其他參與者的某個特定策略而做出最優(yōu)反應(yīng) D.納什均衡中,每個參與者都是在針對其他參與者的最優(yōu)反應(yīng)策略而做出最優(yōu)反應(yīng) 【解析】占優(yōu)策略均衡中,不論其他參與者采取何策略,每個參與者都會選擇其自身的最優(yōu)策略。,二、同時博弈:純策略均衡,6.尋找納什均衡的方法——條件策略下劃線法 對于一個簡單的“二人同時博弈”,可以用一個以二元數(shù)組為元素的支付矩陣來表示,并用“條件策略下劃線法”來確定它的納什均衡。具體步驟如下: (1)把整個博弈的支付矩陣分解為兩個參與人的支付矩陣。 (2)在第一個(即位于整個博弈矩陣左方的)參與人的支付矩陣中,找出每一列的最大者,并在其下畫線。 (3)在第二個(即位于整個博弈矩陣上方的)參與人的支付矩陣中,找出每一行的最大者,并在其下畫線。 (4)將已經(jīng)畫好線的兩個參與人的支付矩陣再合并起來,得到帶有下劃線的整個博弈的支付矩陣。 (5)在帶有下劃線的整個的支付矩陣中,找到兩個數(shù)字之下均畫有線的支付組合。由該支付組合代表的策略組合就是博弈的納什均衡。,表10-5 寡頭博弈:合作與不合作,二、同時博弈:純策略均衡,【例10.2】考慮兩寡頭廠商A和B的如下支付矩陣,二者的(納什)均衡策略組合為( )。 A.(U,L) B.(D,R) C.(U,R) D.(D,L) 【答案】B 【解析】在一個納什均衡里,任何一個參與者都不會改變自己的最優(yōu)策略.如果其他參與者均不改變各自的最優(yōu)策略,即要求任何一個參與者在其他參與者的最優(yōu)策略選擇給定的條件下,其選擇的策略也是最優(yōu)的。對于本題,當(dāng)B選擇U時,A會選擇R,因為5大于3;當(dāng)B選擇D時,A會選擇R,因為2大于0。當(dāng)A選擇L時,B會選擇U,因為4大于3;當(dāng)A選擇R時,B會選擇D,因為1大于0。因此,依據(jù)納什均衡定義,可知(D,R) 是納什均衡。,二、同時博弈:純策略均衡,7.囚徒困境 囚徒困境的博弈模型的假設(shè)條件是:甲、乙兩個被懷疑為合謀偷竊的嫌疑犯被警方抓獲,但警方對他們偷竊的證據(jù)并不充分。他們每一個人都被單獨囚禁,并單獨進(jìn)行審訊,即雙方無法互通信息。警方向這兩個嫌疑犯交待的量刑原則是:如果一方坦白,另一方不坦白,則坦白者從寬處理,判刑1年;不坦白者從重處理,判刑7年。如果兩人都坦白,則每人都各判刑5年。如果兩個都不坦白,則警方由于證據(jù)不足,只能對每個人各判刑2年。表10-6的支付矩陣描述了這一博弈。表中的報酬均為負(fù)數(shù),以表示判刑的年數(shù)。,表10-6 囚徒困境,三、同時博弈:混合策略均衡,并不是所有的博弈都存在納什均衡。比如,如表10-7所示。這博弈就不存在純策略納什均衡,但卻存在混合策略納什均衡。混合策略納什均衡是這樣一種均衡,在這種均衡下,給定其他參與人的策略選擇概率,每個參與人都為自己確定了選擇每一種策略的最優(yōu)概率。,表10-7 社會福利博弈,所有參與人的混合策略的組合構(gòu)成“混合策略組合”。混合策略組合與參與人的支付的乘積之和為參與人的期望支付。當(dāng)其他參與人的混合策略確定之后,某個參與人選擇的可以使自己的期望支付達(dá)到最大的混合策略是該參與人的條件混合策略(其幾何表示為“條件混合策略曲線”)。不同參與人的條件混合策略曲線的“交點”就是混合策略條件下的納什均衡??梢宰C明,混合策略均衡總是存在的。,三、同時博弈:混合策略均衡,【例10.3】在一條狹窄巷子里,兩個年青人騎著自行車相向而行。每人都有兩個策略,即或者選擇“沖過去”或者選擇“避讓”。如果選擇“避讓”,不管對方采取什么策略,他得到的收益都是0。如果其中一個人采取“沖過去”的策略,如果對方采取“避讓”,那么他得到的收益是9;如果對方不避讓,那么他得到的收益是-36。這個博弈有兩個純策略納什均衡和( )。 A.一個混合策略納什均衡,即兩人都以80%概率選擇“避讓”,以20%的概率選擇“沖過去” B.兩個混合策略納什均衡,即每個青年人輪流采取避讓或者沖過去 C.一個混合策略納什均衡,即一人以80%的概率選擇“避讓”,另一人以20%的概率選擇“沖過去” D.一個混合策略納什均衡,即兩人都以40%的概率選擇“避讓”,以60%的概率選擇“沖過去”,三、同時博弈:混合策略均衡,【例10.3】續(xù)【答案】A 【解析】根據(jù)題中條件可寫出兩人的收益矩陣,如表10-8所示。注:混合策略情況下的決策原則有以下兩個: (1)博弈參與者互相不讓對方知道或猜到自己的選擇,因而必須在決策時利用隨機(jī)性來選擇策略,避免任何有規(guī)律性的選擇。 (2)博弈參與者選擇每種策略的概率一定要恰好使對方無機(jī)可乘,即讓對方無法通過有針對性傾向的某一種策略而在博弈中占上風(fēng)。 從10-8可看出,有兩個純策略納什均衡(沖過去,避讓),(避讓,沖過去)。設(shè)甲沖過去的概率為 r ,乙沖過去的概率為 c 。對甲來說,應(yīng)該使乙沖過去的期望收益等于避讓的期望收益,即 -36r+9(1-r)=0,解得r=0.2;對乙來說,也應(yīng)該使甲沖過去的期望收益等于避讓的期望收益,即-36c+9(1-c)=0,解得c=0.2。所以,存在一個混合策略納什均衡。,表10-8 兩人的收益矩陣,四、序貫博弈,“序貫博弈”是參與人的決策和行動有先有后的博弈。描述序貫博弈的更加方便也更加自然的工具是“博弈樹”。博弈樹由“點”(包括“起點”、“中間點”、“終點”)、連接點的“線段”以及標(biāo)在這些點和線段旁邊的文字和數(shù)字組成。在博弈樹中,一個納什均衡代表一條均衡的路徑。在該均衡路徑上,沒有哪個參與人愿意單獨改變自己的策略。,圖10-1 博弈樹,四、序貫博弈,在序貫博弈中,可能存在多個納什均衡的情況。在多個納什均衡中,有些可能并不合理。所謂對納什均衡的“精煉”,就是要從眾多的納什均衡中進(jìn)一步確定“更好”的納什均衡。納什均衡的精煉方法通常是使用所謂的“逆向歸納法”,具體包括以下兩個步驟: 第一步,先從博弈的最后階段的每一個決策點開始,確定相應(yīng)參與人此時所選擇的策略,并把參與人所放棄的其他策略刪除,從而得到原博弈的一個簡化博弈。 第二步,再對簡化博弈重復(fù)步驟一的程序,直到最后,得到原博弈的一個最簡博弈。這個最簡博弈,就是原博弈的解;而在存在多重納什均衡時,它就是對納什均衡的精煉。,四、序貫博弈,【例10.4】在下面的博弈樹中,確定納什均衡和逆向歸納策略。 答:納什均衡是(決策1,決策3)、逆向歸納策略也是(決策1,決策3)。 (1)(決策1,決策3)是一個納什均衡。在該策略組合上,沒有哪個參與人愿意單獨改變策略。首先,參與人B不會單獨改變自己的策略。如果它單獨改變策略,即將原來的決策3變?yōu)闆Q策4,參與人B的支付將從原來的3下降到0。其次,參與人A也不會單獨改變自己的策略。如果它單獨改變策略,即將原來的決策1變?yōu)闆Q策2,則策略組合就成為(決策2,決策3),參與人A的支付將從原來的1下降到0。 (2)采用逆向歸納法,可判斷逆向歸納策略也是(決策1,決策3)。首先,如果參與人A選擇決策1,參與人B肯定不會選擇決策4。另一方面,如果參與人A選擇決策2,參與人B肯定不會選擇決策4。在此情況下,考察參與人A的選擇。由博弈樹可以看出,參與人A的最優(yōu)選擇是決策1。最終結(jié)果是,參與人A選擇決策1,參與人B選擇決策3,即最優(yōu)策略組合為(決策1,決策3)。,五、其他的經(jīng)典博弈案例,1.智豬博弈 豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,另一邊有一個投食口,每踩一下踏板,投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會,搶先吃到落下的食物。當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前,吃光所有的食物;若是大豬踩動了踏板,則還有機(jī)會在小豬吃完之前,跑到食槽,搶到一點殘羹。,五、其他的經(jīng)典博弈案例,1.智豬博弈 有關(guān)描述:無論哪頭豬按一下按鈕會有10個單位的豬食進(jìn)槽,但誰按按鈕誰就需要付2個單位的成本。若大豬先到,大豬吃到9個單位,小豬只能吃1個單位;若同時到,大豬吃7個單位,小豬吃3個單位;若小豬先到,大豬吃6個單位,小豬吃4個單位。,五、其他的經(jīng)典博弈案例,1.智豬博弈,等待,小豬,大豬,按,等待,按,,,,,,,4大于1 0大于-1,,納什均衡:大豬按,小豬等待 各得四個單位(4,4) 多勞者不多得,矩陣分析,五、其他的經(jīng)典博弈案例,1.智豬博弈,結(jié)果是:小豬肯定會選擇“搭便車”策略,而大豬不得不去踩踏板,為一點殘羹,不知疲倦地奔波于踏板和食槽之間。,小樣,肯定不會去踩,我踩,能吃一半,不踩,鐵定餓肚子,唉,沒辦法只能親自動腳了!,我去踩,一口都沒有,我才不去踩呢!,五、其他的經(jīng)典博弈案例,決定大豬、小豬策略的核心指標(biāo):每次落下的食物數(shù)量和踏板與投食口之間的距離。,改變方案一:減量方案。投食僅原來的一半份量。結(jié)果是小豬大豬都不去踩踏板了。 改變方案二:增量方案。投食為原來的一倍份量。結(jié)果是小豬、大豬都會去踩踏板。 改變方案三:減量并且移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ濉?五、其他的經(jīng)典博弈案例,智豬博弈的應(yīng)用: 例1:公司治理。股份公司中,股東承擔(dān)著監(jiān)督經(jīng)理的職能,但股東中有大股東和小股東之分,他們從監(jiān)督中得到的收益不同。監(jiān)督經(jīng)理需要收集信息,花費時間。 在監(jiān)督成本相同的情況下,大股東從監(jiān)督中得到的好處顯然多于小股東。這里,大股東類似“大豬”,小股東類似“小豬”。納什均衡是大股東擔(dān)當(dāng)起搜集信息、監(jiān)督經(jīng)理的責(zé)任,而小股東選擇搭便車。,五、其他的經(jīng)典博弈案例,智豬博弈的應(yīng)用: 例2:股票市場。股市上有大戶,也有小戶,大戶類似“大豬”,小戶類似“小豬”。這時候,對小戶而言,“跟大戶”是最優(yōu)選擇,而大戶則必須自己搜集信息,進(jìn)行分析。,五、其他的經(jīng)典博弈案例,智豬博弈的應(yīng)用: 例3:大企業(yè)與小企業(yè)的關(guān)系。進(jìn)行研究開發(fā),為新產(chǎn)品做廣告,對大企業(yè)是值得的,對小企業(yè)則得不償失,所以,一種可能的情況是,小企業(yè)把精力花在模仿上,或等待大企業(yè)用廣告打開市場后出售廉價產(chǎn)品。,五、其他的經(jīng)典博弈案例,智豬博弈的應(yīng)用: 例4:公共產(chǎn)品的提供上也可能出現(xiàn)。比如村里住兩戶人家,一戶富,一戶窮,有一條路年久失修。這時候,誰修呢? 一般富戶會承擔(dān)起修路的責(zé)任,窮戶則很少會這樣干,因為富戶家常常是高朋滿座,坐車坐轎的都來,而窮戶家只是自己穿著破鞋走路,路修好了他走起來舒服,路修不好他也無所謂。,五、其他的經(jīng)典博弈案例,智豬博弈的應(yīng)用: 例5:改革中也有類似的情況。同樣的改革帶給一部分人的好處可能比另一部分人大得多。這時候,前一部分人比后一部分人更有積極性改革,改革往往就是由這些“大豬”推動的。如改革能創(chuàng)造出更多的“大豬”來,改革的速度就會加快。,五、其他的經(jīng)典博弈案例,2.性別戰(zhàn) 有關(guān)描述:一男一女談戀愛,有些業(yè)余活動要安排,或者去看足球比賽,或者看芭蕾舞演出。男的偏好足球,女的則更喜歡芭蕾,但他們都寧愿在一起,不愿分開。,女,足球,芭蕾,足球,芭蕾,男,矩陣分析,五、其他的經(jīng)典博弈案例,2.性別戰(zhàn) 這個博弈中,有兩個納什均衡:(足球,足球),(芭蕾,芭蕾)。就是說給定一方去足球場,另一方也會去足球場;類似地,給定一方去看芭蕾,另一方也會去看芭蕾。那么,究竟哪一個納什均衡會實際發(fā)生?可能無法知道。但實際生活中,也許是以此看足球,下次看芭蕾,如此循環(huán),形成一種默契。這里還有一個先動優(yōu)勢,比如若男的買票,兩人就會出現(xiàn)在足球場,若女的買票,兩人就會在芭蕾舞廳。,女,足球,芭蕾,足球,芭蕾,男,矩陣分析,五、其他的經(jīng)典博弈案例,3.斗雞博弈 有關(guān)描述:設(shè)想兩個人舉著火棍從獨木橋的兩端走向中央進(jìn)行火拼,每個人都有兩種戰(zhàn)略:繼續(xù)前進(jìn),或退下陣來。若兩人都繼續(xù)前進(jìn),則兩敗俱傷;若一方前進(jìn)另一方退下來,前進(jìn)者取得勝利,退下來的丟了面子;若兩人都退下來,兩人都丟面子。,矩陣分析,五、其他的經(jīng)典博弈案例,3.斗雞博弈 這個博弈也有兩個納什均衡:如果一方進(jìn),另一方的最優(yōu)戰(zhàn)略就是退。兩人都進(jìn)或都退都不是納什均衡。,矩陣分析,五、其他的經(jīng)典博弈案例,斗雞博弈的應(yīng)用: 例1:公共產(chǎn)品的供給也有這種情況。若村子里住的是兩戶富人,有一條路要修,一種可能的情況是,一家修路,另一家就不修;一家不修,另一家就得修(總結(jié):公共產(chǎn)品的供給可能是囚徒博弈,也可能是智豬博弈,還有可能是斗雞博弈,依具體產(chǎn)品而定。),五、其他的經(jīng)典博弈案例,斗雞博弈的應(yīng)用: 例2:蘇美兩個軍事集團(tuán)搶地盤。冷戰(zhàn)期間,蘇美兩個軍事集團(tuán)在世界各地?fù)屨嫉乇P,也是一種斗雞博弈。一般來說,如果一方已經(jīng)搶占了一塊地盤,另一方就設(shè)法占領(lǐng)另一塊地盤,而不是與對手競爭同一塊地盤。,五、其他的經(jīng)典博弈案例,斗雞博弈的應(yīng)用: 例3:警察與游行隊伍。游行隊伍與警察越來越近,這時候,定有一方要退下來,如果警察不讓步,游行隊伍便會向后退;反過來,如果游行隊伍來勢很猛,警察就得撤退。(警察與劫持人質(zhì)的匪徒之間也是如此) 啟示:若每一方都寄望于對方退下陣來,兩敗俱傷的結(jié)局也可能出現(xiàn)。如QQ與360。,五、其他的經(jīng)典博弈案例,4.市場進(jìn)入阻撓 有關(guān)描述:設(shè)想有一個壟斷企業(yè)已在市場上(稱為在位者),另一個企業(yè)虎視眈眈想進(jìn)入(稱為“進(jìn)入者”)。在位者想保持壟斷地位,所以要阻撓進(jìn)入者進(jìn)入。在這個博弈中,進(jìn)入者有兩種戰(zhàn)略可以選擇:進(jìn)入還是不進(jìn)入;在位者也有兩種戰(zhàn)略:默許還是斗爭。假定進(jìn)入之前壟斷利潤為300,進(jìn)入之后寡頭利潤合為100(各得50),進(jìn)入成本為10。,五、其他的經(jīng)典博弈案例,4.市場進(jìn)入阻撓 也有兩個納什均衡,即(進(jìn)入,默許),(不進(jìn)入,斗爭)。為什么(進(jìn)入,默許)是納什均衡?因為給定進(jìn)入者進(jìn)入,在位者選擇默許時得50單位利潤,選擇斗爭時無利潤,所以,最優(yōu)策略是默許。類似,給定在位者選擇默許,進(jìn)入者的最優(yōu)策略是進(jìn)入。 盡管進(jìn)入者選擇不進(jìn)入,默許和斗爭對在位者是一個意思,只有當(dāng)在位者選擇斗爭時,不進(jìn)入才是進(jìn)入者的最優(yōu),所以(不進(jìn)入,斗爭)是納什均衡,而非(不進(jìn)入,默許)。,矩陣分析,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
10 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 微觀經(jīng)濟(jì)學(xué) 高鴻業(yè) 第十 博弈論 初步 ppt 課件
鏈接地址:http://m.hcyjhs8.com/p-1358241.html