日本有码中文字幕视频,在线能看三级网站,日本妇乱子伦视频免费的,中文字幕一页在线

      博弈論案例分析(基本概念解釋以及具體案例分析)

      時間:2022-11-07 08:01:46來源:
      導(dǎo)讀 博弈論案例分析(基本概念講解和具體案例分析) 博弈論,又稱博弈理論或?qū)Σ呃碚?,是研究具有斗爭或競爭性質(zhì)的現(xiàn)象的數(shù)學(xué)理論和方法??紤]博弈論中個體的預(yù)測行為和

      博弈論案例分析(基本概念講解和具體案例分析)

      博弈論,又稱博弈理論或?qū)Σ呃碚?,是研究具有斗爭或競爭性質(zhì)的現(xiàn)象的數(shù)學(xué)理論和方法??紤]博弈論中個體的預(yù)測行為和實際行為,研究其優(yōu)化策略。從表面上看,不同的互動可能表現(xiàn)出相似的激勵結(jié)構(gòu),所以是同一博弈的特例。其中一個著名而有趣的應(yīng)用例子是囚徒困境。

      競爭性或?qū)剐缘男袨榉Q為博弈行為。在這種行為中,參與斗爭或競爭的各方有不同的目標或利益。為了實現(xiàn)各自的目標和利益,各方都必須考慮對手所有可能的行動方案,盡量選擇對自己最有利或最合理的方案。博弈論是研究博弈各方之間是否存在最合理的行為計劃,以及如何尋找這種合理的行為計劃的數(shù)學(xué)理論和方法。

      起源概述

      約翰·馮·諾依曼是一個超級跨界者——他在數(shù)學(xué)、物理、經(jīng)濟學(xué)、計算機等多個領(lǐng)域做出了劃時代的貢獻,留下了很多以他名字命名的東西。比如程序員應(yīng)該都聽說過馮諾依曼系統(tǒng),比如數(shù)學(xué)上的馮諾依曼代數(shù)和馮諾依曼遍歷定理,理論物理上的馮諾依曼量子測量和馮諾依曼遍歷定理。還有很多其他的東西,雖然沒有以他的名字命名,但都是他首先研究出來的,比如:量子力學(xué)的公理化表達,希爾伯特第五問題,連續(xù)幾何(空之間的維數(shù)不是整數(shù)),蒙特卡羅方法,以及歸并排序算法。1944年與奧斯卡·摩根斯坦合作出版了《博弈論與經(jīng)濟行為》,一舉奠定了博弈論體系的基礎(chǔ),因此也被稱為博弈論。

      游戲類型

      合作博弈與非合作博弈

      無論是合作博弈還是非合作博弈,在博弈的過程中都可能出現(xiàn)合作的現(xiàn)象。不同的是,對于合作博弈來說,存在著某種外部約束力,這樣背叛就會受到這種外部約束力的懲罰。對于非合作博弈,沒有這樣的外部約束力,對背叛的懲罰只能依靠博弈過程中的其他參與者。通常,博弈指的是非合作博弈。

      同時博弈和順序博弈

      同時,博弈有時也被稱為靜態(tài)博弈,是指博弈中的任何參與者在選擇自己的行為之前,并不知道其他參與者的行為信息。順序博弈有時被稱為動態(tài)博弈。在這種游戲中,參與者的動作是按時間順序的,后面執(zhí)行動作的玩家可以看到其他玩家前面的動作,然后根據(jù)別人的動作思考自己的行為。

      零和博弈與非零和博弈

      零和游戲這個名字有誤導(dǎo)性,讓很多人以為各方收益之和為零。零和博弈是指博弈結(jié)束后,參與各方的利益總和是不變的(可以是零,可以是正的,也可以是負的)。非零和博弈是指博弈結(jié)束后,參與各方的利益總和是可變的。因此,這種游戲有時被稱為和游戲。對于這種博弈,在某些情況下,參與各方的利益總和可能會增加,從而使各方合作成為可能。

      非重復(fù)博弈和重復(fù)博弈

      非重復(fù)博弈有時也叫單博弈;相應(yīng)地,重復(fù)博弈也稱為多重博弈。重復(fù)博弈可以進一步細分為有限重復(fù)博弈和無限重復(fù)博弈。更嚴格的說是:有限重復(fù)的博弈——確定重復(fù)的博弈,無限重復(fù)的博弈——不確定重復(fù)的博弈。

      游戲策略

      收入矩陣和決策樹

      這兩個概念意在更直觀的描述游戲過程,幫助你看清各方的優(yōu)劣。支付矩陣通常用來描述靜態(tài)博弈(同時博弈),一般用來描述兩個參與者的靜態(tài)博弈。多人的靜態(tài)博弈也可以用收益矩陣來表示,但是畫出來會復(fù)雜很多。由于動態(tài)博弈(序貫博弈)比較復(fù)雜,通常不用“回報矩陣”來描述。決策樹可以用來描述靜態(tài)和動態(tài)博弈。

      策略和策略集合

      以象棋為例。完成一個游戲需要很多步驟。對于每一步,您都有多個決策選項(拿哪一塊,去哪里)。而策略指的是——從第一步到最后一步所有決策選項的總和。你可以通俗地把策略理解為某種算法指導(dǎo)思想,指導(dǎo)你從第一步走到最后一步。所有可能的策略構(gòu)成一組策略。

      有限策略集和無限策略集

      石頭剪子布是典型的有限策略集,只有三個元素。為了說明無限策略集,我們舉一個分蛋糕游戲的例子,一個人把蛋糕隨機分成兩塊,然后另一個人先選擇其中一個。對于蛋糕分享的負責人來說,策略集是無限的。很多人直觀地認為,策略集無限的博弈比策略集有限的博弈復(fù)雜。其實圍棋雖然很復(fù)雜,但是它的策略集還是有限的。相比之下,分享蛋糕的游戲比圍棋簡單得多,但分享蛋糕的游戲有無限多的策略。

      純策略和混合策略

      在實際博弈中,如果你總是在策略集合中選擇某一個策略,這種情況叫做純策略。如果你在博弈過程中總是隨機選擇策略集中的一些策略,這種情況叫做混合策略。如果一個混合策略包含策略集中的所有元素,則稱之為完全混合策略。

      優(yōu)策略

      假設(shè)你有兩個策略A&B,在任何情況下,如果A優(yōu)于B,就叫A優(yōu)于B或者B被A優(yōu),優(yōu)策略也叫優(yōu)策略。如果一個策略可以支配所有其他策略,那么它就是一個支配策略。通俗地說,無論對手采取什么策略,你的優(yōu)勢策略總是比你的其他策略有更好的結(jié)果。有時優(yōu)勢策略會進一步細分為強優(yōu)勢和弱優(yōu)勢。對于前者,無論如何都比其他策略好;對于后者,它在某些情況下優(yōu)于其他策略,在某些情況下與其他策略一樣好。勝利策略,也稱制勝策略,通常只在零和游戲中使用,意思是只要你采取這種策略,無論對方如何應(yīng)對,你總是贏。制勝策略肯定是占優(yōu)策略;但是優(yōu)勢策略不一定是獲勝策略。

      極大極小定理

      比較的說法是最大損失最小化,比較通俗的說法是最壞情況下?lián)p失最小化。這個定理和算法最早是由馮·諾依曼在《博弈論與經(jīng)濟行為》一書中提出的。

      逆向歸納法&這種方法的概念

      它的本質(zhì)是向前看和向后推理。首先,你需要思考你的每一個決定,以及對方在處理你的決定時會采取什么樣的決定。這個思維過程類似于決策樹的擴展,這個擴展過程要一直推演到最后一步,也就是決策樹的葉節(jié)點。至此,你可以看到最后一步雙方的最優(yōu)選擇;然后反推回第一步。當你想用逆向歸納法進行預(yù)測和推理時,前提是——你要獲得充分的信息;換句話說,如果一個玩家沒有掌握足夠的信息,他就不能使用這種方法。

      盜版游戲

      問題描述

      五個海盜搶了100個金幣,商量如何分贓。這五個海賊等級不同(假設(shè)A > B > C > D > E)。首先由等級最高的海盜提出分贓方案,然后進行投票。超過半數(shù)(含半數(shù))同意的,按此方案劃分,游戲結(jié)束;如果贊成的不到一半,就把提出方案的海盜扔到海里喂鯊魚,然后下一級的海盜再提出新的方案;諸如此類。每一個海賊的特點是:足夠理性(追求個人利益最大化),知道別人足夠理性;足夠殘酷(當個人利益相等時,他們傾向于把更多的同伴扔進海里)。

      戰(zhàn)略分析

      為了逆向推理,假設(shè)最后只剩下兩個海盜(D&E)。這時候必須投過半數(shù)的票(D肯定投了他的方案)。在這種情況下,D可以采取最極端的方案——他可以得到全部100個金幣,而E一個也拿不到。

      現(xiàn)在后退一步。當只剩下三個海盜(C,D,E)時,C提出一個計劃。他只需要給e 1個金幣,E就會投贊成票(否則D提出提案時E什么也得不到)。所以在C的計劃中,他自己拿99個金幣,E拿1個金幣。

      再向前一步。只剩下四個海盜(B,C,D,E)。如果B提出一個方案,他當然能想到剛才那些推論。他只要給D 1金幣,D就會支持他(如果C想出方案,D什么也得不到)。所以B提出的方案是B: 99,C: 0,D: 1,E: 0,也能得到一半的支持。

      基于以上分析,再看A的方案,就很明顯了——A:98,B: 0,C: 1,D: 0,e。

      納什均衡

      1951年,美國數(shù)學(xué)家納什發(fā)表了一篇名為《非合作博弈》的小論文,他在論文中提出了納什均衡的概念,并基于不動點定理給出了相應(yīng)的數(shù)學(xué)證明。通俗地說,就是在多人非合作博弈中,如果每個人都不能單方面改善自己的處境,此時的處境就叫做納什均衡。馮·諾依曼在《博弈論與經(jīng)濟行為》一書中已經(jīng)證明,零和博弈中必然存在這樣一個均衡點。納什的貢獻在于他從零和博弈提升到非零和博弈,并證明了這樣的均衡點依然存在。當博弈情況處于納什均衡時,此時系統(tǒng)是穩(wěn)定的。如果每個玩家都足夠理性,他們不愿意改變當前的策略。

      心理因素

      換位考慮

      前面提到的很多游戲相關(guān)的技能,都是靠同理心的能力。你需要站在對手的角度思考,才能看清形勢,更好地選擇自己的策略。一般來說,共情能力越強,批判性思維能力越強。

      理性人假設(shè)

      微觀經(jīng)濟學(xué)在進行數(shù)學(xué)建模時,通常會引入一個理性人假設(shè),假設(shè)市場的行為主體是完全理性的,這里的完全理性也意味著掌握了充分的信息。這個假設(shè)是為了數(shù)學(xué)建模的需要而引入的。任何一個國家的大多數(shù)人都很平庸,他們的一個共同點就是非常不理智。理性的、擁有充分信息的個體是絕對罕見的,理性的人假設(shè)所有設(shè)定市場的行為者都是完全理性的。有了博弈論,這種荒謬的理性人假設(shè)就可以扔進垃圾桶了。

      舊的經(jīng)濟理論(理性人的解釋)會說——所有公司的老板都是完全理性的,有充分的信息知道應(yīng)該生產(chǎn)什么樣的商品才能滿足市場需求。新經(jīng)濟理論(博弈論的解釋)會說公司的老板既優(yōu)秀又平庸。平庸的公司生產(chǎn)的商品沒人要,自然會虧損破產(chǎn)。隨著時間的推移,經(jīng)過自然選擇,幸存下來的公司當然是那些聰明的公司。

      假裝瘋了

      理性玩家把自己偽裝成非理性玩家,可以達到一些虛張聲勢的效果。對這種戰(zhàn)術(shù),我稱之為裝瘋策略。

      影響范圍

      經(jīng)濟學(xué)

      要說博弈論的影響,當然首先要說它對經(jīng)濟學(xué)的影響。有了博弈論,就不需要胡說八道的理性人假設(shè)。這是博弈論誕生后對微觀經(jīng)濟學(xué)的一個很大的影響,還有很多其他的影響。比如,在博弈論誕生之前,傳統(tǒng)微觀經(jīng)濟學(xué)建立了由供求關(guān)系決定價格的數(shù)學(xué)模型。這個模型只考慮了供求關(guān)系的變化對價格的影響,而完全沒有考慮供需雙方的力量對比。如果其中一個供應(yīng)商變強或者另一個變?nèi)?。即使供求保持不變,價格也會發(fā)生變化,朝著有利于強勢一方的方向移動。

      生物

      生物學(xué)中受博弈論影響最大的分支是進化生物學(xué),即進化論。借助博弈論的研究成果,進化生物學(xué)家可以更好地建立物種進化的數(shù)學(xué)模型。


      標簽:
      最新文章