博弈策略的生活解

上傳人:wkd****90 文檔編號(hào):253204414 上傳時(shí)間:2024-12-01 格式:PPT 頁數(shù):49 大?。?35.01KB
收藏 版權(quán)申訴 舉報(bào) 下載
博弈策略的生活解_第1頁
第1頁 / 共49頁
博弈策略的生活解_第2頁
第2頁 / 共49頁
博弈策略的生活解_第3頁
第3頁 / 共49頁

下載文檔到電腦,查找使用更方便

16 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《博弈策略的生活解》由會(huì)員分享,可在線閱讀,更多相關(guān)《博弈策略的生活解(49頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,博弈策略的生活解讀,主講人:黃春建,電話:,18639715222,走近博弈論,對(duì)于許多非數(shù)學(xué)專業(yè)和經(jīng)濟(jì)學(xué)專業(yè)人士來說,博弈論應(yīng)該是一個(gè)極為陌生的概念。但在國外,博弈論作為現(xiàn)代經(jīng)濟(jì)學(xué)的前沿領(lǐng)域,已成為占據(jù)主流的基本分析工具之一。,博弈之道是古已有之,但博弈思想的系統(tǒng)化、數(shù)學(xué)化卻是近幾十年發(fā)展起來的。正是因?yàn)椴┺目茖W(xué)是一門新學(xué)科,我國管理界、經(jīng)濟(jì)界對(duì)博弈論與信息經(jīng)濟(jì)學(xué)的研究還是停留在引進(jìn)介紹層面上,他們發(fā)表的成果大多是堆砌龐雜的數(shù)學(xué)算法與令人眩目的數(shù)學(xué)模型。,我們學(xué)習(xí)博弈的目的就是通過博弈相關(guān)知識(shí)及著名的博弈

2、案例,諸如囚徒困境、智豬博弈、斗雞博弈等等,研究人們?nèi)绾芜M(jìn)行決策,以及這種決策如何達(dá)到均衡的問題。每個(gè)博弈者在決定采取何種行動(dòng)時(shí),不但要根據(jù)自身的利益和目的行事,還必須考慮到他的決策行為對(duì)其他人的可能影響,以及其他人的反應(yīng)行為的可能后果,通過選擇最佳行動(dòng)計(jì)劃,來尋求收益或效用的最大化。這門課在一定程度上,是為了提高在校大學(xué)生感性認(rèn)識(shí)和理性認(rèn)識(shí)的融合,明白做人做事的道理,掌握分析和處理一些事情的方法和技巧。,一、博弈基礎(chǔ)知識(shí),博弈的定義:一些個(gè)人、團(tuán)隊(duì)或其他組織,面對(duì)一定的環(huán)境條件、在一定的規(guī)則約束下,依靠所掌握的信息,同時(shí)或先或后,一次或多次,從各自允許選擇的行為或策略進(jìn)行選擇并加以實(shí)施,并從

3、中各自取得相應(yīng)結(jié)果或收益的過程。,博弈的構(gòu)成要素:,1,、博弈要有,2,個(gè)或,2,個(gè)以上的參與者(,Player,)。,2,、博弈要有參與各方爭奪的資源或收益(,Resources,或,Payoff,)。,3,、參與者有自己能夠選擇的策略(,Strategy,)。,4,、參與者擁有一定量的信息(,Information,)。,博弈的分類:,1,、分為合作博弈與非合作博弈。如果各博弈方能達(dá)成某種有約束力的契約或默契,以選擇共同的策略,此種博弈就是合作博弈。反之,就屬于非合作博弈。,2,、分為零和博弈、常和博弈與變和博弈。零和博弈指的是所有博弈方的得益總和為零。常和博弈則是指所有博弈方的得益總和等

4、于非零的常數(shù)。變和博弈則是指隨著博弈參與者選擇的策略不同,各方的得益總和也不同。,3,、分為靜態(tài)博弈與動(dòng)態(tài)博弈。所有博弈方同時(shí)或可看作同時(shí)選擇策略,采取行動(dòng)的博弈是靜態(tài)博弈。,4,、,分為完全信息博弈與不完全信息博弈。,納什均衡,定義:在給定別人最優(yōu)的情況下,自己最優(yōu)選擇達(dá)成的均衡。,假設(shè)有,n,個(gè)局中人參與博弈,給定其他人策略的條件下,每個(gè)局中人選擇自己的 最優(yōu)策略(個(gè)人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構(gòu)成一個(gè)策略組合(,Strategy Profile,)。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策

5、略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實(shí)質(zhì)上說,是一種非合作博弈狀態(tài)。,納什均衡達(dá)成時(shí),并不意味著博弈雙方都處于不動(dòng)的狀態(tài),在順序博弈中這個(gè)均衡是在博弈者連續(xù)的動(dòng)作與反應(yīng)中達(dá)成的。納什均衡也不意味著博弈雙方達(dá)到了一個(gè)整體的最優(yōu)狀態(tài),以下的囚徒困境就是一個(gè)例子。,二、囚徒困境,兩個(gè)共同偷竊的犯罪嫌疑人甲和乙被帶進(jìn)警察局。警方對(duì)兩名犯罪嫌疑人實(shí)行隔離關(guān)押,隔離審訊,每個(gè)犯罪嫌疑人都無法觀察同伴的選擇。,警方懷疑他們作案,但手中并沒有掌握確鑿證據(jù),于是明確地分別告知兩名犯罪嫌疑人:對(duì)他們犯罪事實(shí)的認(rèn)定及相應(yīng)的量刑完全取決于他們自己的供認(rèn)。如果其中一方坦白,而另一方抵賴,供認(rèn)方將不受懲

6、罰,無罪釋放,另一方會(huì)被重判,10,年;如果雙方都供認(rèn),各被判,5,年;而如果雙方均不認(rèn)罪,因?yàn)榫秸也坏狡渌C據(jù),則無罪釋放。,乙抵賴,乙供認(rèn),甲抵賴,二人無罪釋放,甲判,10,年,乙無罪釋放,甲供認(rèn),甲無罪釋放,乙判,10,年,甲乙各判,5,年,體現(xiàn)囚徒困境基本精神,背叛,形成囚徒困境的機(jī)制,擔(dān)心自己成為傻瓜(處于囚徒困境時(shí),兩害相權(quán)取其輕),啟示:,囚徒困境這個(gè)模型,幾乎是博弈論的代名詞。兩個(gè)基于“坦白從寬,抗拒從嚴(yán)”審訊的囚徒,從理性的角度出發(fā),會(huì)產(chǎn)生怎樣的結(jié)局?結(jié)果卻是,從個(gè)人理性并追求個(gè)人利益最大化,那么二人皆坦白,也就是背叛。這在四種策略中并不占優(yōu),那為什么不采用集體最優(yōu)策略而合

7、作呢?很簡單的集體優(yōu)化,必然侵害個(gè)人利益的最大化。當(dāng)然這一切前提是理性假設(shè),也就是著名的經(jīng)濟(jì)人假設(shè):經(jīng)濟(jì)學(xué)中的人都是“小人”(管理學(xué)則認(rèn)為人是“君子”)。破解這一困境的途徑則是打破信息孤立,而執(zhí)法者的反制則是維持孤立或者加強(qiáng)威脅。無論背叛還是合作,誰在這里面堅(jiān)持到最后,誰將取勝。,三、重復(fù)博弈,合作的開始,重復(fù)博弈是一種特殊的博弈,在博弈中,同樣結(jié)構(gòu)的博弈重復(fù)許多次,其中的每次博弈稱為“階段博弈”(,stage games,)。在每個(gè)階段博弈中,參與人可能同時(shí)行動(dòng),也可能不同時(shí)行動(dòng)。因?yàn)槠渌麉⑴c人過去的行動(dòng)的歷史是可以觀測(cè)的,因此在重復(fù)博弈中,每個(gè)參與人可以使自己在每個(gè)階段選擇的策略依賴于其他

8、參與人過去的行為。,對(duì)未來的預(yù)期是影響我們行為的重要因素。一種是預(yù)期收益:我這樣做,將來有什么好處;一種是預(yù)期風(fēng)險(xiǎn):我這樣做可能將來面臨,什么,問題。這都將影響個(gè)人的策略。,資深的博弈論專家羅伯特,-,奧曼在,1959,年指出,,人與人的長期交往是避免短期沖突、走向協(xié)作的重要機(jī)制。,在現(xiàn)實(shí)環(huán)境中,存在著一些道德因素,可以化解個(gè)人理性與群體理性的矛盾,維系整個(gè)社會(huì)的穩(wěn)定。,有限次的囚徒困境情況不同于無限次的囚徒困境的重復(fù)博弈。當(dāng)臨近博弈的終點(diǎn)時(shí),采取不合作策略的可能性加大。,即使參與人以前的所有策略均為合作策略,如果被告知下一次博弈是最后一次,那么肯定采取不合作的策略。,所以要是博弈終點(diǎn)不確定性

9、,只要,存在繼續(xù)合作的機(jī)會(huì),背叛就會(huì)被抑制。,無名氏定理:博弈中雙方合作時(shí)得益最大,但若一方不遵守合作約定,必定是另一方合作者吃虧。所以需要引入懲罰機(jī)制:誰違約,就要處罰他,使他不敢違約。博弈一方之所以會(huì)與另外一位合作,只是因?yàn)樗?,如果他今天被騙,明天還能對(duì)欺騙實(shí)施懲罰。奧曼先生把這一洞察結(jié)論稱之為“無名氏定理”,啟示:,每一次人際交往其實(shí)都可以簡化為兩種基本選擇:合作還是背叛。在人際交往中普遍存在囚徒困境:明知合作能帶來雙贏,但理性的自私和信任的缺乏導(dǎo)致合作難以產(chǎn)生。而且,如果博弈是一次性,那么必然加劇雙方進(jìn)行“坦白”的決心,選擇相互背叛。而現(xiàn)實(shí)生活中反復(fù)交往的人際關(guān)系,則是一種“不定次

10、數(shù)的重復(fù)博弈”。在較長的視野內(nèi),人與人交往關(guān)系的重復(fù)造成“低頭不見抬頭見”的關(guān)系,可以使交往主體之間走向合作。,4,、一報(bào)還一報(bào),人際交往個(gè)體原則,重復(fù)博弈理論上導(dǎo)致了合作的產(chǎn)生,但是誰也不能保證合作的繼續(xù),合作的代價(jià)是建立在對(duì)方背叛的風(fēng)險(xiǎn)之上的。如果個(gè)人放棄未來收益或當(dāng)前背叛收益大于未來收益,背叛的風(fēng)險(xiǎn)仍然存在。哪么在重復(fù)博弈怎樣的策略才是最優(yōu)。經(jīng)過若干科學(xué)家在計(jì)算機(jī),PK,后,及其原始的“以牙還牙”策略脫穎而出,固然這個(gè)策略簡單至極,其威力卻無窮,以至于人們?cè)谕婆踹@一策略的后發(fā)現(xiàn),這一策略有其可怕性。一旦某個(gè)環(huán)節(jié)出現(xiàn)背叛,據(jù)此原則行事的博弈將永無休止背叛下去。所以我們又設(shè)計(jì)了修正的一報(bào)還一

11、報(bào)策略,作為人際關(guān)系中的指導(dǎo)。,生活中有很多事情,法律和道德不好約束,美國密西根大學(xué)學(xué)者羅伯特,愛克斯羅德提出了一報(bào)還一報(bào)策略。他是一個(gè)政治科學(xué)家,研究方向是人與人之間的合作關(guān)系。,研究前提:一、每個(gè)人都是自私的;二、沒有權(quán)威干預(yù)個(gè)人決策。研究的問題,:,一、人為什么要合作。二、人什么時(shí)候合作、什么時(shí)候不合作。三、如何使別人與你合作。,一報(bào)還一報(bào)策略優(yōu)點(diǎn):,1,、,善良,,是指它第一部總是向?qū)Ψ奖磉_(dá)善意。它堅(jiān)持永遠(yuǎn)不首先背叛對(duì)方,開始總是選擇合作,而不是一開始就選擇背叛或主動(dòng)作弊。,2,、,可激怒,,是指對(duì)方出現(xiàn)背叛行動(dòng)時(shí),它能夠及時(shí)識(shí)別并一定要采取背叛的行動(dòng)來報(bào)復(fù),不會(huì)讓背叛者逍遙法外。,3

12、,、,寬容,,是指它不會(huì)因?yàn)閯e人一次背叛,長時(shí)間懷恨在心或者沒完沒了的報(bào)復(fù),而是在對(duì)方改過自新、重新回到合作軌道時(shí),能既往不咎的恢復(fù)合作。,4,、,簡單,,是指它的邏輯清晰,易于識(shí)別,能讓對(duì)方在較短時(shí)間內(nèi)辨別出來其策略所在。,5,、,不妒忌,,是指它不耍小聰明,不占對(duì)方便宜,不在任何雙邊關(guān)系中爭強(qiáng)好勝。,一報(bào)還一報(bào)策略應(yīng)用于現(xiàn)實(shí)社會(huì)的缺陷:由于現(xiàn)實(shí)中的人會(huì)有誤會(huì)的存在,一報(bào)還一報(bào)應(yīng)用于現(xiàn)實(shí)社會(huì)主要由兩個(gè)缺陷:,一是太容易激發(fā)背叛;二是它缺少一個(gè)宣布“到此為止”的機(jī)制。,如何克服:在“在一在二不在三”的原則下,采用修正的一報(bào)還一報(bào)策略,一是寬大的一報(bào)還一報(bào),即以一定的概率不報(bào)復(fù)對(duì)方的背叛;二是悔

13、過的一報(bào)還一報(bào),即以一定的概率主動(dòng)停止背叛。,處事哲學(xué):以直報(bào)怨(擯棄以德報(bào)怨和以怨報(bào)怨),對(duì)于正在戀愛中的人們來說,獲得幸福愛情的博弈原則應(yīng)該是:,(,1,)善意而不是惡意的對(duì)待戀人。這個(gè)道理很簡單了,無須多說。(,2,)寬容而不是尖刻地對(duì)待戀人。幸福的戀人可能并不是忠貞不二的,當(dāng)然也肯定不是見異思遷的,他們能夠生活得愉快,關(guān)鍵是能夠彼此寬容,既寬容對(duì)方的缺點(diǎn),甚至也寬容他偶爾的不忠貞。而尖刻地對(duì)待戀人的人,對(duì)戀人的偶爾不忠貞總是不肯遷就的人,往往也都不會(huì)幸福。,(,3,)強(qiáng)硬而不是軟弱地對(duì)待戀人。就是要在我永遠(yuǎn)愛你的善意的前提下,做到有愛必報(bào),有恨也必報(bào),以眼還眼,以牙還牙,以其人之道,還

14、治其人之身。這其中,當(dāng)然是要有限度和分寸的。比如對(duì)戀人與其他異性的親熱行為,要有極其強(qiáng)烈的敏感與斬釘截鐵地回報(bào),當(dāng)然,每次發(fā)脾氣都是有限度的,而且還要能寬容對(duì)方。(,4,)簡單明了而不是山環(huán)水繞地對(duì)待戀人。愛克斯羅德的實(shí)驗(yàn)證明,在博弈過程中,過分復(fù)雜的策略使得對(duì)手難于理解,無所適從,因而難以建立穩(wěn)定的合作關(guān)系。,其實(shí),戀愛只是一個(gè)例子,在生活中的各種各樣的人類交往中,修正的一報(bào)還一報(bào)策略都是上上之選,因?yàn)樗龠M(jìn)了人們之間的長久的合作,取得了共贏。那么在交往中具體采用什么樣的方法提高合作性呢?(,1,)要建立持久地關(guān)系。即使是愛情,也需要建立婚姻契約以維持雙方的合作。(,2,)要增強(qiáng)識(shí)別對(duì)方行動(dòng)

15、的能力,如果不清楚對(duì)方是合作還是不合作,就沒法回報(bào)他了。(,3,)要維持聲譽(yù),說要報(bào)復(fù)就一定要做到,人家才知道你是不好欺負(fù)的,才不敢不與你合作。(,4,)能夠分步完成的對(duì)局不要一次完成,以維持長久關(guān)系,比如,貿(mào)易、談判都要分步進(jìn)行,以促使對(duì)方采取合作態(tài)度。(,5,)不要嫉妒人家的成功,,一報(bào)還一報(bào),正是這樣的典范。(,6,)不要首先背叛,以免擔(dān)上罪魁禍?zhǔn)椎牡赖聣毫?。?7,)不僅對(duì)背叛要回報(bào),對(duì)合作也要作出回報(bào)。(,8,)不要耍小聰明,占人家便宜。友善、有原則、寬容、簡單、不嫉妒朋友的成功,這些信條應(yīng)是我們每個(gè)人的為人處世之道。,五、人質(zhì)困境,多個(gè)人的囚徒困境,在一群人面對(duì)威脅或損失時(shí),“第一

16、個(gè)采取行動(dòng)”的決定是很難做出的,因?yàn)樗馕吨鴮⒏冻鰬K重代價(jià)。這個(gè)困境便就叫做人質(zhì)困境。,需要協(xié)調(diào)和個(gè)人犧牲才能有所收獲的事情,做起來可能具有人們難以想像的難度。,僅僅用道德的呼喚來讓人們挺身而出與邪惡作斗爭是不現(xiàn)實(shí)的,而且,要任何一個(gè)人在人質(zhì)困境中首先采取行動(dòng)并獨(dú)自承擔(dān)報(bào)復(fù)的后果都是不公平的。,解決方法:提升人的群體理性,加強(qiáng)溝通與合作。,人質(zhì)困境問題產(chǎn)生的機(jī)制稱為“手風(fēng)琴效應(yīng)”,每一個(gè)折疊都會(huì)推動(dòng)或拉動(dòng)鄰近一個(gè)折疊。每一個(gè)體都做了相同的選擇,比如一車人面對(duì)兩個(gè)劫匪選擇沉默,但都是錯(cuò)誤的選擇。,個(gè)體理性和完全理性:,以個(gè)體利益最大為目標(biāo)的利息沒那個(gè)被稱為個(gè)體理性,而有完美的分析判斷能力和不會(huì)犯選擇行為的錯(cuò)誤被稱為完全理性。,完全理性包括追求最大利益的理性意識(shí)、分析推理能力、識(shí)別判斷能力、記憶能力和準(zhǔn)確行為能力等多方面的完美表現(xiàn),其中任何一方面不完美就不屬于完全理性。,六、酒吧博弈,混沌系統(tǒng)中的策略,酒吧問題是美國人阿瑟,(W.B.Arthur),教授提出的。,酒吧問題是指這樣一個(gè)博弈:有一群人,比如總共有,100,人,每個(gè)周末均要決定,是去附近的一個(gè)酒吧活動(dòng)還是呆在家里。該酒吧的容量是

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔

相關(guān)搜索

關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!