博弈论

阅读 / 问答 / 标签

什么是博弈论?悖伦?高手进!!

以上的回答一看就是网页复制博弈论我学过 虽解释的不是那么规范 不过可以就我所理解简单的说下博弈论主要是教你如何运用科学的方法 对2种或2种以上不同的选择状况做比较 最后选择最优方案而悖论就是说 一个理论(一般是公认的或成立的)在它成立的时候,可能又有与他的优点相反的另一面现象或状况的存在,这个对立面结论就是原结论的悖论

博弈论起源于哪个国家?

中国 没错

博弈论入门

第1节 什么是博弈论:从“囚徒困境”说起一天,警局接到报案,一位富翁被杀死在自己的别墅中,家中的财物也被洗劫一空。经过多方调查,警方最终将嫌疑人锁定在杰克和亚当身上,因为事发当晚有人看到他们两个神色慌张地从被害人的家中跑出来。警方到两人的家中进行搜查,结果发现了一部分被害人家中失窃的财物,于是将二人作为谋杀和盗窃嫌疑人拘留。 但是到了拘留所里面,两人都矢口否认自己杀过人,他们辩称自己只是路过那里,想进去偷点东西,结果进去的时候发现主人已经被人杀死了,于是他们便随便拿了点东西就走了。这样的解释不能让人信服,再说,谁都知道在判刑方面杀人要比盗窃严重得多。警察决定将两人隔离审讯。 隔离审讯的时候,警察告诉杰克:“尽管你们不承认,但是我知道人就是你们两个杀的,事情早晚会水落石出的。现在我给你一个坦白的机会,如果你坦白了,亚当拒不承认,那你就是主动自首,同时协助警方破案,你将被立即释放,亚当则要坐10年牢;如果你们都坦白了,每人坐8年牢;都不坦白的话,可能以入室盗窃罪判你们每人1年,如何选择你自己想一想吧。”同样的话,警察也说给了亚当。 一般人可能认为杰克和亚当都会选择不坦白,这样他们只能以入室盗窃的罪名被判刑,每人只需坐1年牢。这对于两人来说是最好的一种结局。可结果会是这样的吗?答案是否定的,两人都选择了招供,结果各被判了8年。 事情为什么会这样呢?杰克和亚当为什么会做出这样“不理智”的选择呢?其实这种结果正是两人的理智造成的。我们先看一下两人坦白与否及其结局的矩阵图:当警察把坦白与否的后果告诉杰克的时候,杰克心中就会开始盘算坦白对自己有利,还是不坦白对自己有利。杰克会想,如果选择坦白,要么当即释放,要么同亚当一起坐8年牢;要是选择不坦白,虽然可能只坐1年牢,但也可能坐10年牢。虽然(1,1)对两人而言是最好的一种结局,但是由于是被分开审讯,信息不通,所以谁也没法保证对方是否会选择坦白。选择坦白的结局是8年或者0年,选择不坦白的结局是10年或者1年,在不知道对方选择的情况下,选择坦白对自己来说是一种优势策略。于是,杰克会选择坦白。同时,亚当也会这样想。最终的结局便是两个人都选择坦白,每人都要坐8年牢。上面这个案例就是著名的“囚徒困境”模式,是博弈论中最出名的一个模式。为什么杰克和亚当都选择了对自己最有利的策略,最后得到的却是最差的结果呢?这其中便蕴涵着博弈论的道理。 博弈论是指双方或者多方在竞争、合作、冲突等情况下,充分了解各方信息,并依此选择一种能为本方争取最大利益的最优决策的理论。 “囚徒困境”中杰克和亚当便是参与博弈的双方,也称为博弈参与者。两人之所以陷入困境,是因为他们没有选择对两人来说最优的决策,也就是同时不坦白。而根本原因则是两人被隔离审讯,无法掌握对方的信息。所以,看似每个人都做出了对自己最有利的策略,结果却是两败俱伤。 我们身边的很多事情和典故中也有博弈论的应用,我们就用大家比较熟悉的“田忌赛马”这个故事来解释一下什么是博弈论。 齐国大将田忌,平日里喜欢与贵族赛马赌钱。当时赛马的规矩是每一方出上等马、中等马、下等马各一匹,共赛三场,三局两胜制。由于田忌的马比贵族们的马略逊一筹,所以十赌九输。当时孙膑在田忌的府中做客,经常见田忌同贵族们赛马,对赛马的比赛规则和双方马的实力差距都比较了解。这天田忌赛马又输了,非常沮丧地回到府中。孙膑见状,便对田忌说:“明天你尽管同那些贵族们下大赌注,我保证让你把以前输的全赢回来。”田忌相信了孙膑,第二天约贵族赛马,并下了千金赌注。 孙膑为什么敢打保证呢?因为他对这场赛马的博弈做了分析:双方都派上等、中等、下等马各一匹,田忌每一等级的马都比对方同一等级的马慢一点,因为没有规定出场顺序,所以比赛的对阵形式可能有六种,每一种对阵形式的结局是很容易猜测的: 第一种情况:上等马对上等马,中等马对中等马,下等马对下等马。结局:三局零胜。第二种情况:上等马对上等马,下等马对中等马,中等马对下等马。结局:三局一胜。 第三种情况:中等马对上等马,上等马对中等马,下等马对下等马。结局:三局一胜。 第四种情况:中等马对上等马,下等马对中等马,上等马对下等马。结局:三局一胜。 第五种情况:下等马对上等马,上等马对中等马,中等马对下等马。结局:三局两胜。 第六种情况:下等马对上等马,中等马对中等马,上等马对下等马。结局:三局一胜。 六种对阵形式中,只有一种能使田忌取胜,孙膑采取的正是这一种。赛前孙膑对田忌说:“你用自己的下等马去对阵他的上等马,然后用上等马去对阵他的中等马,最后用中等马去对阵他的下等马。”比赛结束之后,田忌三局两胜,赢得了比赛。田忌从此对孙膑刮目相看,并将他推荐给了齐威王。同样的马,只是调整了出场顺序,便取得截然相反的结果。这里边蕴涵着博弈论的道理。 在田忌赛马这个故事中,田忌同齐国的贵族便是博弈的双方,也称为博弈的参与者。孙膑充分了解了各方的信息,也就是比赛的规则与各匹马之间的实力差距,并在六种可以选择的策略中帮田忌选择了一个能争取最大利益的策略,也就是最优策略。所以说,这是一个很典型的博弈论在实际中应用的例子。 在这里还要区分一下博弈与博弈论的概念,以免搞混。它们既有共同点,又有很大的差别。“博弈”的字面意思是指赌博和下围棋,用来比喻为了利益进行竞争。自从人类存在的那一天开始,博弈便存在,我们身边也无时无刻不在上演着一场场博弈。而博弈论则是一种系统的理论,属于应用数学的一个分支。可以说博弈中体现着博弈论的思想,是博弈论在现实中的体现。 博弈作为一种争取利益的竞争,始终伴随着人类的发展。但是博弈论作为一门科学理论,是1928年由美籍匈牙利数学家约翰·冯·诺依曼建立起来的。他同时也是计算机的发明者,计算机在发明最初不过是庞大、笨重的算数器,但是今天已经深深影响到了我们生活、工作的各个方面。博弈论也是如此,最初冯·诺依曼证明了博弈论基本原理的时候,它只不过是一个数学理论,对现实生活影响甚微,所以没有引起人们的注意。直到1944年,冯·诺依曼与摩根斯坦合著的《博弈论与经济行为》发行出版。这本书的面世意义重大,先前冯·诺依曼的博弈理论主要研究二人博弈,这本书将研究范围推广到多人博弈;同时,还将博弈论从一种单纯的理论应用于经济领域。在经济领域的应用,奠定了博弈论发展为一门学科的基础和理论体系。 谈到博弈论的发展,就不能不提到约翰·福布斯·纳什。这是一位传奇的人物,他于1950年写出了论文《n人博弈中的均衡点》,当时年仅22岁。第二年他又发表了另外一篇论文《非合作博弈》。这两篇论文将博弈论的研究范围和应用领域大大推广。论文中提出的“纳什均衡”已经成为博弈论中最重要和最基础的理论。他也因此成为一代大师,并于1994年获得诺贝尔经济学奖。后面我们还会详细介绍纳什其人与“纳什均衡”理论。 经济学史上有三次伟大的革命,它们是“边际分析革命”“凯恩斯革命”和“博弈论革命”。博弈论为人们提供了一种解决问题的新方法。 博弈论发展到今天,已经成了一门比较完善的学科,应用范围也涉及各个领域。研究博弈论的经济学家获得诺贝尔经济学奖的比例是最高的,由此也可以看出博弈论的重要性和影响力。2005年的诺贝尔经济学奖又一次颁发给了研究博弈论的经济学家,瑞典皇家科学院给出的授奖理由是“他们对博弈论的分析,加深了我们对合作和冲突的理解”。 那么博弈论对我们个人的生活有什么影响呢?这种影响可以说是无处不在的。 假设,你去酒店参加一个同学的生日聚会,当天晚上他的亲人、朋友、同学、同事去了很多人,大家都玩得很高兴。可就在这时,外面突然失火,并且火势很大,无法扑灭,只能逃生。酒店里面人很多,但是安全出口只有两个。一个安全出口距离较近,但是人特别多,大家都在拥挤;另外一个安全出口人很少,但是距离相对远。如果抛开道德因素来考虑,这时你该如何选择? 这便是一个博弈论的问题。我们知道,博弈论就是在一定情况下,充分了解各方面信息,并做出最优决策的一种理论。在这个例子里,你身处火灾之中,了解到的信息就是远近共有两个安全门,以及这两个门的拥挤程度。在这里,你需要做出最优决策,也就是最有可能逃生的选择。那应该如何选择呢?

博弈论是什么?

分公司的

什么是红黑博弈论?

红黑博弈论没有这个的具体定义。它体现为三个理论。一、狗屎理论与零和博弈说是有两个经济学家,在马路上散步,便讨论经济问题甲经济学家看见了一堆狗屎,思索着对乙经济学家说。你吃了这堆狗屎吧,我给你100万块钱。乙经济学家犹豫了一会儿,但是还是经受不住诱惑,吃了那堆狗屎,当然,作为条件,甲经济学家给了他100万块钱过了一会儿,乙经济学家也看见了一堆狗屎,就对甲经济学家说:你吃了这堆狗屎吧,我也给你100万块钱。甲经济学家犹豫了一会儿,但是还是经受不住诱惑,吃了那堆狗屎当然,作为条件,乙经济学家把甲给他的 100万还了回去。故事还没有完走着走着,乙经济学家忽然缓过神来了,对甲说不对阿,我们谁也没有挣到钱,却吃了两对狗屎。。。甲也换过神了,思考了一会儿说:可是,我们创造了200万的GNP阿!你领悟到什么了吗?零和游戏原理源于博弈论。两人对弈,在大多数情况下,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输棋为-1分,那么,这两人得分之和就是:1+(-1)=0。博弈论的英文名为game theory,直译就是“游戏理论”。游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远是零。“零和游戏”之所以广受关注,主要是因为人们发现,在社会的方方面面都有与“零和游戏”类似的局面,胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。二、囚徒困境与非合作博弈 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人A和B,并从他们的住处搜出被害人家中丢失的财物。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。这个时候,聪明的警官找他们谈话,分别告诉他们说:“你们的偷盗罪确凿,所以可以判你们2年刑期。但是,我可以和你做个交易。如果你招了,他不招,那么你会作为证人无罪释放,他将被判10年徒刑;如果你招了,他也招了,你们都将被判5年有期徒刑;如果他招了,你不招,他无罪释放,你被判无期徒刑,终身囚禁;如果你们都不招,各判2年。” 很多人都会误认为,既然两个囚犯最好的结果是都不招供,两人都只被判2年,那么,两个囚犯都选择不招供就是这个博弈的最终结果。然而,人算不如天算,“囚徒困境”之所以称为“困境”正是因为这个博弈的最终结局恰恰是最坏的结果,即两个囚犯统统招供,结果都被判有期徒刑5年。反过来说,这也是警官的聪明之处。警官采取的游戏规则必然会让两名囚犯坦白罪行,认罪伏法。对一个博弈来说,游戏规则非常地重要,适宜的规则才能够达到目的。在我们的日常生活中莫不如此,规则制订者往往利用条件制定出有利于自身的规章制度。  三、智猪博弈这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。  那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 以博弈论的视角浅析红黑游戏红黑游戏,我第一次接触这项游戏,很感兴趣,游戏规则是这样的:首先,选出一名同学作信息员,把剩下的人分为两组:红方和黑方,两组同学各自选出一名同学作组长,然后双方出牌,积分规则如下:1、如果双方都是黑色,各积3分,2、如果一方是黑色,另一方是红色,则出红色牌的一方积5分,出黑色牌的一方积-5分,3、如果双方都是红色牌,则双方都积-3分。每局游戏分为六轮,每一轮中各组分别讨论本组出牌的颜色,少数服从多数,然后把结果告诉信息员,游戏过程中双方不得交谈,第三轮中所得积分翻倍,第六轮中所得积分三倍计算。最后以分数最高且为正分的一组获胜,若双方都是负分则都输。游戏开始之后,我们一致同意每轮都出红色,这样至少保证对方肯定不会赢,我们还有获胜的机会,但是,没想到对方和我们想的一样,每次也都是出红色,最后结果是双方都是负分,没有赢家。玩了两局之后,我们组首先有人提议,认为应该出黑色,要相信对方,这样双方才能有共赢的机会,有人赞成,也有人反对,反对的人认为如果我们出黑色,对方出红色,则给了对方正分,对我们不利,最后,经过激烈的讨论,我们组还是同意这局出黑色。果不其然,对方又一次出了红色,结果,这轮我们组被扣了5分,对方则是得了5分,刚才提出反对意见的同学纷纷向组长抱怨,说下次不能出黑色,一定要出红色,此时,刚才那位同学又站了出来,他说我们应该给对方一次机会,如果我们出了红色,最后结果还是两败俱伤,这样对双方都不利,我们应该相信对方能感受到我们的诚意,我们被他的话打动,再一次出了黑色,出了之后我们都很紧张,担心对方再次出红色,因为这是第三轮,积分要翻倍,等了很久,对方还没出牌,显然也是在讨论,过了一会儿,信息员过来告诉我们,对方出的是——黑色!双方各赢6分!我们一下子沸腾了,我们的诚意获得了回报,对方也明白了我们意思,只有合作,双方才有赢的可能,互相不信任的结果是两败俱伤。接下来的一轮,我们很快出了黑色,对方也是黑色,接下来的几轮也都是如此,最后,游戏没玩完,我们就都从屋子里冲了出去,互相拥抱祝贺对方,此刻,我们都已经体会到这个游戏的真谛:培养一种相互理解、相互信任的友谊。游戏过后,我们都明白了:生活中人与人之间不仅仅是互相做对,更多的是要追求一种双赢。这个游戏我一直记忆犹新,不仅仅是从其中学到了一则做人的道理,加之最近正在修读博弈论的相关课程,从这个游戏中我也是窥探到了一丝博弈论的身影。豪尔绍尼曾这样定义博弈论:博弈论是关于策略相互作用的理论,就是说,他是关于社会形势中理性行为的理论,其中每个局中人对自己行动的选择必须以他对其他局中人将如何反应的判断为基础。简言之:博弈论主要研究人与人之间“斗智”的形式和后果。

关于博弈论,经济学或管理的各种原理

你应该看一下那个经济学原理里边有很多在经济方面的基本理论,和原理,想深入了解还得再看些其他方面的书籍我的观点和上边这位仁兄差不多,

用博弈论肯德基麦当劳为什么相依为邻

不是吧,很多地方都是靠在一起的啊

博弈论中 Dominance-Solvable Game 的翻译

这...如果仅考虑自身利益,对两人来说认输都是严格劣势。较真的话就不存在博弈了...没有共同知识。

博弈论主要讲什么?

博弈论就是研究互动决策的理论,所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。博弈论定义:我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成相对均衡的语文学理论,称为博弈论。博弈论的意义:博弈论(Game Theory) 又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。博弈论又被称为对策论(Game·Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。博弈论的应用领域:博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。博弈要素:1、决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。(博弈圣经)2、对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。(博弈圣经)3、生物亲序:所有生物在恶劣、未知的环境中都有寻找规律和有序的本能。在博弈中指参与者有从混乱的环境中等待、寻找有序的亲近行为。(博弈圣经)4、局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。5、策略(strategiges):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。6、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。7、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

博弈论的原理是什么?哪有详细教授博弈论的网站?

博弈论的概念 博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈论的发展 博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 博弈论的基本概念 博弈要素 (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。 (2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。 有了上述定义,就立即得到纳什定理: 任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。 纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。 纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。 但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。 塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 博弈的类型 (1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。 (3)完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息;反之,则称为不完全信息。 (4)静态博弈和动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。 动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。 财产分配问题和夏普里值(Shapley value) 考虑这样一个合作博弈:a、b、c、投票决定如何分配100万,他们分别拥有50%、40%、10%的权力,规则规定,当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配,a50万、b40万、c10万c向a提出:a70万、b0、c30万b向a提出:a80万、b20万、c0…… 权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。 夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。 次序 abc acb bac bca cab cba 关键加入者 a c a c a b 由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 所以a,b,c应分别获得100万的2/3,1/6,1/6。 博弈论的意义 弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。

博弈论里的囚徒困境怎么解决

我认为有三种方法可以解决囚徒困境:1.外部力量补充导致payoff改变。比如,选择坦白的囚犯会受到组织的惩罚。2.不固定次数的重复博弈。之所以强调不固定次数,是因为根据“倒推法”,如果知道博弈次数,那么在最后一轮就应该选择“不合作”,因此在倒数第二轮也应该选择“不合作”,一只可以推至,在第一轮就应该选择不合作。(reference: 维基百科 固定次数的囚徒困境)3.教育对于“教育”我的理解有这样两种:共有知识的完全信息这里我认为的共有知识是指:对方知道我知道共同选择合作是最好的选择;对方知道我也知道他知道共同选择合作是最好的选择。也就是说不是基于相互之间的无强制力的信任,而是基于对方的common knowledge。

什么和静态博弈论,什么是动态博弈论呢?

根据博弈的过程 分为静态和动态博弈静态博弈 就是双方同时进行博弈或者可以看做同时选择策略的博弈成为静态博弈static games各博弈方的选择和行动不仅有先后顺序,而且后选择后行动的博弈方在自己选择行动之前,可以看到其他博弈方的行动选择,甚至还包括自己的行动选择。这种博弈无论如何都无法看做同时决策,所以叫做动态博弈 dynamic games

关于博弈论的提出

博弈要素 (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。 (2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。 有了上述定义,就立即得到纳什定理: 任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。 纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。 纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。 但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。 塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 博弈的类型 (1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。 (3)完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息;反之,则称为不完全信息。 (4)静态博弈和动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。 动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。 财产分配问题和夏普里值(Shapley value) 考虑这样一个合作博弈:a、b、c、投票决定如何分配100万,他们分别拥有50%、40%、10%的权力,规则规定,当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配,a50万、b40万、c10万c向a提出:a70万、b0、c30万b向a提出:a80万、b20万、c0…… 权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。 夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。 次序abc acb bac bca cab cba 关键加入者 a c a c a b 由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 所以a,b,c应分别获得100万的2/3,1/6,1/6。求采纳

假设两个人在玩博弈论,每个人有2个纯策略。问题是这个博弈论最多有几个纯策略纳什均衡?最少有多少个?

最多4个pure,最少0个pure。最多4个,选什么都一样就是4个,比如无论两人选什么,每个人的payoff都是0。那么每一组pure都是纳什均衡。(如果强制要求每个payoff都不一样,那么最多是2个。)最少0个。例如两个人选择Yes或No,Player1是和对方一样时payoff为1,不一样时payoff为-1;Player2反之,和player1一样时payoff为-1,不一样时payoff为1。这个就不存在pure纳什均衡。只有一个mix纳什均衡,两个player都半半的几率选择yes和no。

博弈论中的支付是什么意思

我最近也在看,搞不懂为什么要用支付,感觉应该还有更合适的词才对

博弈论中,局中人从一个博弈得到的结果被称为 1.收益 2.支付 3.决策 4.利润

应该叫支付,payoff

博弈论中的收益(payoff)和效用(utility)有什么区别与联系呢

按照范里安的说法效用是描述偏好的一种方式,效用函数是为每个可能的消费束赋值的方法。效用函数满足偏序性。 在博弈中,收益是指一个特定战略组合下参与人得到的期望效用水平,参与人的目标就是选择战略最大化期望效用函数。 在博弈论中通常采用收益的说法

博弈论纳什均衡?

  纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。  纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。  假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1] ),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。  纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

博弈论的纳什均衡

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*) ≤ 偶对(a*,b*) ≥偶对(a*,b)。对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。   纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 囚徒困境在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner"s dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈 [Prisoner"s dilemma]A╲B 坦白 抵赖 坦白 8,8 0,10 抵赖 10,0 1,1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的策发生改变。比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破“行规”。我们正处于大数据时代,向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。 智猪博弈 一、经济学中的“智猪博弈”(Pigs"payoffs) 这个例子讲的是:假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽(两猪均在食槽端),另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是在去往食槽的路上会有两个单位猪食的体能消耗,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。智猪博弈由纳什于1950年提出。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:   小猪    行动 等待 大猪 行动 5,1 4,4  等待 9,-1 0,0 从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。在智猪博弈中,虽然小猪的“捡现成”的行为从道义上来讲令人不齿,但是博弈策略的主要目的不正是使用谋略最大化自己的利益吗? 美女的硬币 一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学考虑就是另外一回事了,这个游戏真的够公平吗? 绅士/美女 女正面 女反面 正面 3,-3 -2,+2 反面 -2,+2 1,-1 假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)这个方程通俗的说就是在对手一直出正面你得到的利益,和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入,计算结果是-1/8元。同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y)解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。看起来这个博弈模型似乎没有什么用处,但是其实这可能牵涉了金融市场定价中最重要的一个模型:定价权重模型了。总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来,并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,更方便我们对规则进行制定和调整,使其最终按照我们所预期的目的进行运作。

博弈论 纳什均衡

囚徒困境 智猪博弈 纳什均衡

一分钟看懂博弈论——纳什均衡

最后我能给你解释道德绑架为什么让你反感,别觉得是学术你就不看了。 囚徒困境 两个囚徒被抓了,警察为了让他们坦白交代,分别提审两个人,这里分三种情况 1、两个人都不交代,没有证据,直接无罪释放 2、其中一个人交代了,一个人没交代,交代了的因为戴罪立功,判1年,没交代的判9年 3、两个人都交代,每个人判6年 两个人没有串供的机会,所以只能自行判断,假设每个人交代和不交代都占50%,则 第一个人没说的时候判刑的危险(后果*概率)50%*0+50%*9=4.5 第一个人交代了的时候判刑的危险(后果*概率)50%*1+50%*6=3.5 所以第一个人的最优策略是:交代,同理可证第二个人的最优策略一样是交代 所以两个人都交代是最符合从个人出发的最佳策略 但是如果从整体出发,两个人都交代是四个选择里面最差的,因为两个人一共要判12年,哪怕是一个人交代一个人没交代,都只需要两个人一共判10年 这就是纳什均衡:每个人都从个人最佳选择的角度出发,最终集体的利益受损。 有人说看不懂这个推导,那么你直接记住这句话即可:聪明人在一块,因为自私,选出一个傻子方案。 以上是为了解释清楚举了一个极端的例子,实际上根据条件不一样,每个人都从个人最佳选择的角度出发,最终不一定导致集体的选择最差,但是一定不是最好。 对于纳什均衡的应用: 1、你的对手和队友中一定有蠢货(也可能是受情绪影响而做出愚蠢的选择),这导致任何精确的算计都不精确 2、但是采取任何博弈的时候,都应该假定对手是聪明人和老司机。 3、一个社会和一个整体不美好,不是因为某一些人坏或者某一些人傻,而是因为所有聪明人按照纳什均衡的博弈的结果。 4、博弈的根据是给对方一个可以相信的美好的未来。 5、保持友善,因为没有一个必胜的策略。 6、当你有中等能力的时候,不要做任何博弈,直接翻牌。(这一点有严谨的证明,公式太多,写了你也不爱看) 7、多次博弈的过程中,双方或者多方会突破纳什均衡,这一突破,往往会形成道德——欺诈游戏中那个傻女猪脚完成了凑齐红苹果的伟大壮举——突破纳什均衡是让双方共赢的结果 最后这一点多解释一下,如果双方都进去了以后,再出来,又一起作案,这次提前约定好,只要是被抓住,我们都不说,不就都无罪释放了吗?结果双方突破了纳什均衡——提前约束好的行为,就是道德(举的例子有点反,明白意思就好)。 所以为什么很多人现在感觉到了道德绑架:这跟我们提前说好的不一样啊,凭什么我的道德让我判9年你判1年啊。明白了这些,我们看社会很多现象瞬间就会有不一样的视角,希望对你有所帮助

博弈论——纳什均衡

纳什均衡,Nash equilibrium,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。——百度百科。 简单地说,纳什均衡就是别人采取那样的策略,我不得不采取这样的策略,在别人不改变策略的情况下,我也无法采取别的策略,如如形成了一种“非合作博弈均衡”。 你可能听说过这个故事。老师让全班所有的同学想一个0到100之间的整数,说谁想的数字最接近全班平均值的2/3,谁就获胜。那么聪明的学生就会这么想:假设如果全班的同学都随机选了一个数字,那么平均值就是50,我的答案应该是50的2/3,也就是33;如果再进一步想,如果大部分的同学都足够聪明,想的也是33,那么平均值就变成了33,那么更聪明的我答案就要变成22。但是如果全班的同学也足够聪明,想到了22,那么我的答案就是22/3*2=14。所以假定所有的学生都会这一样一步一步的推理,最后得出的答案就是0。而事实上没有哪个班的学生能聪明到这个程度,也就是给那个最极端的答案0. 生活中的大多数人也不会聪明到那个程度,去做那个极端的推理并执行。但是博弈论可以帮助我们理解社会上一个看似复杂又矛盾的现象。比如为中小学生“减负”的呼声一直没断过,中学生作业多、任务重已成为一个事实,很多学生晚上要花3个小时甚至4个小时做作业,到了晚上11点、12点还不能睡觉,周末的各学科的练习卷会有十几二十份,根本没有玩的时间。但是与此同时,在周末或者晚上很多家长又把孩子送出去加各种各样的兴趣班、辅导班。这不是让孩子的负担更重了吗?难道大多数的家长不知道孩子的学业已经很沉重了吗? 难道学校的想布置这么多作业吗?难道学习喜欢做作业到深夜吗?难道家长喜欢晚上周末不怨其烦的送孩子去各种班吗?答案当然都是不是。有人这些都是被逼的。不错,其实这是三个“纳什均衡”。 先看学校的老师为什么要布置这么多的作业。那是因为别的学校也布置了那么多的作业。如果自己的学科不布置那么多的作业,那么学生的各项学科技能(考试成绩)将落后于同一地区的兄弟学校。这是老师不远看到的,也是学校领导不愿意遇见的,很多时候也是家长的意愿,即想看到我的孩子有个好成绩。 再看学生为什么不得不完成那么多的作业。其实也是被逼的。同班同学都完成了,为什么你完不成?这是老师的责问。同班同学都完成了,为什么我完不成?这是自我能力的怀疑。所以孩子们都孜孜不倦地完成了一天数个小时的作业量。完不成的孩子,要么已经完成了自我否定,破罐子破摔,成了老师、家长眼中的“差生”;要么鼓起勇气对抗到底,成了老师、家长眼中的“顽劣”、熊孩子。 最后家长为什么要送孩子去各种兴趣班、辅导班。那是因为别的家长也把孩子送过去了。别家的孩子去某某钢琴班,考了个十级被某学校提前录取了;那家的孩子去了舞蹈班拿了个金奖,都去北京演出了;哪家的孩子去了哪个辅导班,成绩一下子提高了30分,上次考试都进了班级前10名。所以没有哪个家长是做得住的,不管孩子有多少兴趣,有没有时间玩自己的游戏,都得送过去。 理解了博弈论中“纳什均衡”,可以帮助我们懂得人生中的很多无奈。我想这也是自我修养的一种提升。

学习博弈论,需要打好哪些基础?

博弈论又被称为对策论(GameTheory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的RobertAumann教授的说法,博弈论就是研究互动决策的理论。所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把636f7079e799bee5baa631333332636437别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。  博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。  按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiralgametheory)也日益兴起。

博弈论中Stackelberg Differential Games是什么含义

这个是博弈论中著名的斯塔克尔伯格模型,由德国经济学家斯塔克尔伯格(H. Von Stackelberg)在上世纪30年代(1934年)提出。知道博弈里的模型么,古诺什么的,在古诺模型里,竞争厂商在市场上的地位是平等的,因而它们的行为是相似的。而且,它们的决策是同时的。当企业甲在作决策时,它并不知道企业乙的决策。但事实上,在有些市场,竞争厂商之间的地位并不是对称的,市场地位的不对称引起了决策次序的不对称,通常,小企业先观察到大企业的行为,再决定自己的对策。德国经济学家斯塔克尔伯格建立的模型就反映了这种不对称的竞争。在斯塔克尔伯格的寡头理论中,提出了将寡头厂商的角色定位为“领导者”与“追随者”的分析范式。一般来说,古诺模型中互为追随者的两个厂商势均力敌。而斯塔克尔伯格的寡头厂商模型中,一个是实力雄厚的领导者,一个是实力相对较弱的追随者。该模型的基本假定条件是,在一个寡头行业中有两个厂商,他们生产相同的产品,其中,一个寡头厂商是处于支配地位的领导者,另一个是寡头厂商的追随者;另外,与古诺模型一样,每个厂商的决策变量都是产量,即每个厂商都会选择自己的最优产量来实现利润最大化。 两种模型有不同的公式来反映不同厂商的策略定价。

搜电影名,内容是一个人有幻想症,创作了博弈论,之后幻想自己进入国家最高机密组织,后来幻想自己被追杀

《美丽心灵》A Beautiful Mind导演:朗·霍华德Ron Howard主演:罗素·克洛Russel Crowe 珍尼弗·康纳利Jennifer Connelly 艾德·哈里斯Ed Harris 亚当·戈德堡Adam Goldberg 克里斯托弗·普拉默Christopher Plummer类型:传记级别:PG-13发行:环球(美国);梦工场(国际)首映:2001年12月21日官方网站:abeautifulmind.com剧情简介 这故事里的主人公是确有其人的。天才的数学家 约翰·纳什 在麻省理工学院工作,很年轻时就作出惊人的数学发现,奠定了经济学中博弈论的数学基础,开始具有国际声誉。但30岁时他被诊断出患有妄想型精神分裂症。他的感情生活也并不单纯,包括一次因为在男洗手间的不适宜的暴露自己被逮捕,并在婚外有了孩子。他在自己的天才与狂乱中历经痛苦。他的那个美丽的头脑,不仅有过人智力更有过人勇气,使他终不至于沉入深渊。这是长而痛苦的旅程,然而疾病逐渐恢复,他更是因为关于博弈论的研究成果获得诺贝尔经济学奖。但是这并非一般意义上的传记电影。“它不是通过事实,而是通过想象来试图赞美一个生命的精神,并达到一些真理。”

纳什博弈论论文集的作者简介

约翰,纳什JohnNash,Jr(1928),美国普林斯顿大学教授。1994年因其对“非合作博弈均衡分析,以及对博弈论的其他贡献”,荣获诺贝尔经济学奖。

什么是 ont-shot deviation 啊,博弈论里边的,,,概念啊,用法什么的。。。

  应该是one-shot deviation吧。  它是指一次性交易,即一锤子买卖,因为这种交易一般是不好的,所以用的是deviation(偏差)。  为什么一锤子买卖是不好的呢?因为交易次数是有限的。博弈论告诉我们只要交易次数是有限的,就无法形成交易,即使存在也是不好的交易。因为要想保证交易是好的,即交易的商品货真价实,物有所值,就必须有惩罚机制,对造假者进行惩罚以至于他不敢进行欺诈交易,这个惩罚机制就是欺诈方不守信用,受欺诈的一方将永远不再与之交易,基于长远的考虑,欺诈交易的代价是巨大的。但是如果交易是有限的,比如1000次,那么交易最后一次之后双方将不会再交易,这意味着惩罚机制不会存在了,交易的一方就会有欺诈的激励,因为另一方无法惩罚他。当然另一方会预期到这一点,这样他就会拒绝和他进行第1000次交易。这样的话他们只能交易999次,这又是有限次交易,重复以上的逻辑,他们将不会进行第999次交易。依此类推,最终的结局是它们一次也不会交易。如果是无限次交易,则不会出现上述情况,因为无限交易保证了惩罚机制的长久存在。  但是总存在逼不得已的情况,会存在一次性交易,比如你在火车上饿的不行,旅行时的食宿等等。我们注意到一个现象:在火车站买的东西经常是假的,因为你不可能与之进行无限次交易,惩罚机制不存在使得他们有进行欺诈交易的激励,而且在火车站买东西是有限次交易的极端,即一次性交易,这更加容易导致欺诈交易的发生,我们习惯称之为一锤子买卖。

什么是 博弈论

楼上的你懂不懂啊?不懂别瞎搅和,你这个叫选择论...

关于 John Nash 和博弈论的英文版资料

给你找了一些,希望对你有帮助:Nash, John Forbes(born June 13, 1928, Bluefield, W.Va., U.S.) U.S. mathematician. He earned a doctorate from Princeton University at 22. He began teaching at Massachusetts Institute of Technology in 1951 but left in the late 1950s because of mental illness; thereafter he was informally associated with Princeton. Beginning in the 1950s with his influential thesis “Non-cooperative Games,” Nash established the mathematical principles of game theory. His theory, known as the Nash solution or Nash equilibrium, attempted to explain the dynamics of threat and action among competitors. Despite its practical limitations, it was widely applied by business strategists. He shared the 1994 Nobel Prize in Economics with John C. Harsanyi (b. 1920) and Reinhard Selten (b. 1930). A film version of his life, A Beautiful Mind (2001), won an Academy Award for best picture.game theoryn.A mathematical method of decision-making in which a competitive situation is analyzed to determine the optimal course of action for an interested party, often used in political, economic, and military planning. Also called theory of games.games, theory of, group of mathematical theories first developed by John Von Neumann and Oskar Morgenstern. A game consists of a set of rules governing a competitive situation in which from two to n individuals or groups of individuals choose strategies designed to maximize their own winnings or to minimize their opponent"s winnings; the rules specify the possible actions for each player, the amount of information received by each as play progresses, and the amounts won or lost in various situations. Von Neumann and Morgenstern restricted their attention to zero-sum games, that is, to games in which no player can gain except at another"s expense.This restriction was overcome by the work of John F. Nash during the early 1950s. Nash mathematically clarified the distinction between cooperative and noncooperative games. In noncooperative games, unlike cooperative ones, no outside authority assures that players stick to the same predetermined rules, and binding agreements are not feasible. Further, he recognized that in noncooperative games there exist sets of optimal strategies (so-called Nash equilibria) used by the players in a game such that no player can benefit by unilaterally changing his or her strategy if the strategies of the other players remain unchanged. Because noncooperative games are common in the real world, the discovery revolutionized game theory. Nash also recognized that such an equilibrium solution would also be optimal in cooperative games. He suggested approaching the study of cooperative games via their reduction to noncooperative form and proposed a methodology, called the Nash program, for doing so. Nash also introduced the concept of bargaining, in which two or more players collude to produce a situation where failure to collude would make each of them worse off.The theory of games applies statistical logic to the choice of strategies. It is applicable to many fields, including military problems and economics. The Nobel Memorial Prize in Economic Sciences was awarded to Nash, John Harsanyi, and Reinhard Selten (1994) and to Robert J. Aumann and Thomas C. Schelling (2005) for work in applying game theory to aspects of economics.http://www.answers.com/topic/john-forbes-nash

关于博弈论的问题,帮解答下啊

因为事物皆有两面性,很多情况下一个社会问题是正确还是错误并不是绝对的。相对而言更符合社会发展潮流的是正确的,违背则是错误的。而博弈论:在整个社会

商业博弈论是什么理论

  博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。  博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。  从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈  按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。  经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。  博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型;以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。

博弈论的相关问题,完美价格歧视以及纳什均衡。

(a) Pi=(0.2(2-p)+0.8(3-p))(p-1)FOC: 3.8-2p=0 (First-order condition)p=1.9Pi=0.81 (profit)(b) Market 1: Pi=(2-p)(p-1)FOC: p=1.5Pi=0.25Market 2: Pi=(3-p)(p-1)FOC: p=2Pi=1Pi=0.2*0.25+0.8*1=0.85(c) 区分两类消费者,强制接受对应的价格。(貌似有三条,自己去书上翻定义)后面两问不确定。帮我检查下数学。2. Betty 1000 2000 3000 1000 100,0 100,0 100,0Wilma 2000 0,100 1100,0 1100,0 3000 0,100 0,1100 2100,0No dominant strategy for both players.Strategy 3000 for Betty is weakly dominated. But the game cannot be solved by iterated deletion, since 3000 is only weakly dominated.Pure strategy Nash equilibrium: (100,0)If you really want mixed strategy Nash equilibrium, please send a message to me

纳什均衡与非合作博弈论是同个概念吗?若不是,那两者是什么关系。

纳什平衡又称为非合作博弈论。

小白也懂博弈论:纳什均衡

原文发布于自己的博客平台【 http://www.jetchen.cn/nash-equilibrium/ 】 具有竞争或对抗性质的行为称为博弈行为,并且博弈理论在经济学、国际关系、军事战略等很多领域都有广泛的应用,其中以纳什均衡为代表的非合作性博弈理论在日常中最为常用。 在很多场景下,比如玩德州扑克等游戏时,虽然有些时候选择的策略并不一定是全局的最优解,但却是相对于其他人的策略而做出的最优解,即每个人都是对自己最有利的解决方案,我们将其称为为 纳什均衡 。 纳什均衡(或者纳什平衡),Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。 再解释一下,所谓纳什均衡,指的是参与者的一种策略组合,在该策略上,任何参与人单独改变策略都不会得到好处,即 每个人的策略都是对其他人的策略的最优反应 。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。 枯燥的描述很难理解,下面使用几个案例来理解下。 背景:有两个囚犯A和B,犯事儿进去了,然后警官对其分开审讯,所以A和B是没有机会进行串供的 奖惩:如果双双招供,则各判2年,如果双双不招供,则各判1年,如果一个招供一个不招供,则招供的人立即释放,不招供的人判刑十年 结果:最后囚犯A和B都会选择招供,所以各判2年,这个便是此时的纳什均衡。 但是明明双双不招供才是最优解啊,其实不然,回头再看一下概念,纳什均衡其实并不是全局的最优解,而是每个人相对于每个人的策略而做出的最佳策略,下面来解释下。 我们来建立一个数学模型,使用 -2、-1、0、-10 来形容上面的奖惩,见下面的分析图。 A的心路历程: 所以,不管B招不招供,A只要招供了,对A而言是最优的策略。 同理,对于B的心路历程也相似,B也会选择招供: 所以最终的结果是A和B都选择了招供。 即此时的纳什均衡点为:A和B都招供。 综述,敲黑板,纳什均衡的前提是: 决策圈中的个体是独立,不合作,不横向沟通的 背景:有两只猪,一只是大猪,另一只是小猪,然后有一个食槽,里面会有食物落下,但是需要去远处按一下按钮,每次按一下按钮,食槽中便会补满食物。但是呢,在按按钮的来回路上,是需要消耗一定的能量的。 奖惩:跑过去按一下按钮再跑回来吃食物,会消耗一些能量,记为 -2,每次食槽中补满食物,总食物量为 10份,大猪先吃的话能吃到 9 份,小猪先吃的话,大猪能吃到 6 份,一起吃的话,大猪能吃到 7 份 结果:大猪会选择去按按钮,而小猪会选择不去按按钮,即在原地等着。 小猪心路历程: 所以,不管大猪怎么样,小猪都会选择在原地等待。 大猪心路历程: 所以,表面上看,大猪的决策是受到小猪的决策所影响的,但是分析小猪的心路历程得知,小猪是不会去按按钮的,那么大猪最后的决策还是会选择去按按钮,这样大猪的收益才会最大化。 所以综上,最终结果是大猪去按按钮,而小猪在原地等待着。 即此时的纳什均衡点为:大猪去,小猪不去。 在每次参与者都只有有限种策略选择并且允许混合策略的前提下,纳什均衡是一定存在的。 比如选举、群体之间的利益竞争、会议中的法案竞争等,是必然存在纳什均衡的。 以公司间的价格战为例:如果对方一直降价,那我方继续降价必然会出现亏本买卖,然而如果不降价,也会出现失去市场的情况,损失更大,但如果对方不降价,我方更要降价才能谋得一丝丝利益,所以只要出现价格战,必然会两败俱伤,这是纳什均衡体现的必然结局。所以要改变这种结局,双方必须坐下来谈判寻求新的利益评估分摊方案,从而改变原先的利益格局(比如当年京东和当当的一场价格战,最终以双方各占某一方面的主市场从而获得新的利益分割方案)。 纳什均衡是基于非合作博弈论的平衡不动点解 例如上文的囚徒困境问题,如果两个囚徒是有合作的,则必然不存在纳什均衡点。 所以,在现实生活中,纳什均衡这一博弈是很重要但是也是很有限的,因为在很多情况下,即使知道平衡不动点必然存在,但是往往却很难找到。 纳什均衡(这一非合作博弈论模型)仅仅是突破了博弈论中的一个局限 因为在社会这一庞大的博弈环境下,还会掺杂着复杂的经济行为,虽然社会中的大家并非是集体合作性的,但在这种庞大的非合作性对象中,纳什均衡点是几乎不可能找到的。 纳什均衡属于NP问题 (摘自 wik i上面的一段话,暂时看不懂但却觉得很有道理)纳什均衡属于NP问题,Daskalakis 证明它属于 NP 问题的一个子集,不是通常认为的 NP-完全问题,而是 PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。

用博弈论 分析一下 三国的智取南郡片段

三国的很多故事其实我觉得都不能用简单的博弈来分析,就像上次有人问我华容道的博弈一样。这里硬要说博弈呢,就是一开始,周瑜和刘备都要打南郡,他们的策略可以是一起打,但是必然最后要抢,收益就低了;也可以是周瑜说的我先打,打不了你打;或者刘备也可以这样说。从周瑜的角度,他倾向于策略我先打,因为他觉得他能打下,而刘备这里诸葛亮算准了打的话会牵制兵力,有机可乘,所以同意了周瑜先打。而周瑜打了以后,诸葛亮算准了兵力的牵制时机,乘曹仁偷袭之虚夺了南郡。曹仁这里呢,人家来打,他没的选,但是第一次防守胜利后,他选择了偷袭,觉得可以彻底打败周瑜,不但中了计,还让诸葛亮抄了后路,鹬蚌相争,渔翁得利。

甚么是博弈论?

博弈论指 企 业 中 最 新 推 出 的 一 种 理 论 方 法,即 研 究 机 智 而 又 理 性 的 决 策 者 之 间 冲 突 与 合 作 的 理 论,其 目 的 在 于 通 过 各 方 采 取 对 其 最 有 利 的 决 策 而 达 到 博 弈 各 方 的 均 衡 。 它 包 括 博 弈 的 参 与 者,用 于 决 策 所 需 的 信 息,战 略 、 支 付 函 数 、 结 果 、 均 衡 等 因 素,其 中 支 付 函 数 是 参 与 者 真 正 关 心 的 东 西,均 衡 是 所 有 者 最 优 战 略 的 组 成 。 1994年10月11日,瑞典皇家科学院宣布,由于纳什博士对非合作博弈理论中的均衡问题进行了开创性分析,与哈尔萨尼教授( P rofessor JohnC.Harsanyi)和泽尔滕教授( P rofessorDr. Reinhard Selten)分享了该年度的诺贝尔经济学奖,奖金93万美元。 博弈论研究人们的策略互动行为。博弈论认为:一、人是理性的,即人人都会在约束条件下最大化自身的利益;二、人们在交往合作中有冲突,行为互相影响,而且信息不对称。博弈论研究人们的行为,在直接相互作用时的决策,以及决策的均衡问题。换句话说,博弈论研究如何使得人们在市场经济中,自愿做出大家都遵守和实施的有效制度安排,以增进社会的福利的机制。 博弈论是深刻理解经济行为和社会问题的基础。现在人们说的博弈论,一般指非合作博弈论。它的特征是:人们行为相互作用时,当事人不能达成一个有约束力的协议。或者说,行为人之间的合约对于签约人没有实质性约束力。例如,现实中的非合作博弈问题的例子是,石油卡特尔欧佩克的产量协议,对于其成员国就没有约束力。你心里想什么我不知道,我也不想让你知道我心里想什么。因此,协议经常不能坚持到底,总有一国先行增产降价以谋求自己更高的利润。 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。 这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿 *** :如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。 从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。 A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。 所以, A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么, A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。 当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。让我们看看冷战时期两个超级大国将自己锁定在一场40年的军备竞赛中,其结果对双方都毫无益处。还有各国的贸易保护主义的永恒倾向也很能说明问题。 比如贸易自由与壁垒,这个问题对于刚刚加入 WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。 X国试图对 Y国进行进口贸易限制,比如提高关税,则 Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如 X和 Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。 博弈论强调用互惠策略(一报还一报),促进行为人之间的合作,形成基于个体理性(利己动机)的集体理性结局(正的外部性或者利他行为),形成社会的道德共识。简单说就是:你对我好,我就对你好;你对我不好,我也对你不好。我对你好,是为了你能继续对我好。我对你不好,不是睚眦必报的互相损害,而是要将对方重新拉回合作的轨道。实现的机制是,通过对恶劣行为的惩罚,驱使行为人合作。因为从多次博弈和演进的角度看,合作比不合作的收益大于成本,不合作比合作的收益小于成本。这就是博弈论应用于经济制度设计的原理之一,也可以看做是可供选择的人类社会道德共识演进的机制。 在分析改革过程中各阶层或者群体利益消长和继续改革的态度时,博弈论为我们提供了一个简洁深刻的工具。改革必须有人付出成本(包括风险),而改革结果的收益是大家共享。有人认识到这一点,就不愿努力改革,生怕别人搭便车。这样的人多了,就会出现人人希望改革,很少人投身改革的局面,都维持在旧体制下度日。如此,怕别人搭便车,结果人人没有车搭,大家都步行。这种思考方式,也可以用来分析公共物品的供给中的机会主义问题。 我们还可以将这里的思想引申到商品(包括股票)定价过程和制度。市场的功能是缩小人与人之间的距离,使得个人很容易在议价过程中转向众多的潜在交易伙伴。价格的制定,以非人格定价为好。非人格定价,是指市场价格对任何人都一样。明码标价就是一种非人格定价。这表面看起来像是卖方定价,但是在法治较好的竞争性市场中,买者可以选择多个卖方,以用脚投票的方式间接定价。股票市场的合法投机套利活动,可能促进非人格定价的形成,减少因人而异的人格定价行为,从而使机会主义行为减少,降低内生交易成本。这符合我们大多数股民的共同利益,揭明了我们为什么要在股市交易中戒除腐败和违法活动的基本道理。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。 参考: stdaily 博弈论(Game Theory),有时也称为对策论,或者赛局理论,应用数学的一个分支 目前在生物学,经济学,国际关系,电脑科学 政治学,军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner"s dilemma)。 具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 生物学家使用博弈理论来理解和预测进化(论)的某些结果。例如,John Maynard Smith 和Gee R. Price 在1973年发表于Nature上的论文中提出的「evolutionarily stable strategy」的这个概念就是使用了博弈理论。还可以参见进化博弈理论(evolutionary game theory)和行为生态学(behavioral ecology)。 博弈论也应用于数学的其他分支,如机率,统计和线性规划等。 博弈论简史 对于博弈论的研究,开始于策墨洛(Zermelo 1913),波雷尔(Borel 1921)及冯·诺伊曼(von Neumann 1928),后来由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Menstern,1944,1947)首次对其系统化和形式化(参照Myerson 1991)。随后约翰·福布斯·纳什(John Forbes Nash Jr. 1950 1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。 理想空间 [Blog + 相簿]u+YC"v/n9By*^ m5G;ye [编辑] 当代博弈论的「三大家」和「四君子」 「三大家」包括约翰·福布斯·纳什、约翰·C·海萨尼,以及莱因哈德·泽尔腾。这三人同时因为他们对博弈论的突出贡献而获得1994年的瑞典银行经济学奖(也称诺贝尔经济学奖)。 「四君子」包括罗伯特·J·奥曼、肯·宾摩尔、戴维·克瑞普斯,以及阿里尔·鲁宾斯坦。 理想空间 [Blog + 相簿]f+Kk(f{I2E+Y [编辑] 博弈分类 博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。 目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还又很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。 参考: web

什纳的博弈论(也就是《美丽心灵》里的博弈论。)

In game theory, Nash equilibrium (named after John Forbes Nash, who proposed it) is a solution concept of a game involving two or more players, in which each player is assumed to know the equilibrium strategies of the other players, and no player has anything to gain by changing only his own strategy unilaterally. If each player has chosen a strategy and no player can benefit by changing his or her strategy while the other players keep theirs unchanged, then the current set of strategy choices and the corresponding payoffs constitute a Nash equilibrium.Informal definitionInformally, a set of strategies is a Nash equilibrium if no player can do better by unilaterally changing his or her strategy. To see what this means, imagine that each player is told the strategies of the others. Suppose then that each player asks himself or herself: "Knowing the strategies of the other players, and treating the strategies of the other players as set in stone, can I benefit by changing my strategy?"If any player would answer "Yes", then that set of strategies is not a Nash equilibrium. But if every player prefers not to switch (or is indifferent between switching and not) then the set of strategies is a Nash equilibrium. Thus, each strategy in a Nash equilibrium is a best response to all other strategies in that equilibrium.The Nash equilibrium may sometimes appear non-rational in a third-person perspective. This is because it may happen that a Nash equilibrium is not Pareto optimal.The Nash equilibrium may also have non-rational consequences in sequential games because players may "threaten" each other with non-rational moves. For such games the Subgame perfect Nash equilibrium may be more meaningful as a tool of analysis.[edit]Formal definitionLet (S, f) be a game with n players, where Si is the strategy set for player i, S=S1 X S2 ... X Sn is the set of strategy profiles and f=(f1(x), ..., fn(x)) is the payoff function. Let x u2212 i be a strategy profile of all players except for player i. When each player i {1, ..., n} chooses strategy xi resulting in strategy profile x = (x1, ..., xn) then player i obtains payoff fi(x). Note that the payoff depends on the strategy profile chosen, i.e. on the strategy chosen by player i as well as the strategies chosen by all the other players. A strategy profile x* S is a Nash equilibrium (NE) if no unilateral deviation in strategy by any single player is profitable for that player, that isA game can have either a pure-strategy or a mixed Nash Equilibrium, (in the latter a pure strategy is chosen stochastically with a fixed frequency). Nash proved that if we allow mixed strategies, then every game with a finite number of players in which each player can choose from finitely many pure strategies has at least one Nash equilibrium.When the inequality above holds strictly (with > instead of ) for all players and all feasible alternative strategies, then the equilibrium is classified as a strict Nash equilibrium. If instead, for some player, there is exact equality between and some other strategy in the set S, then the equilibrium is classified as a weak Nash equilibrium.

博弈论属于什么专业

问题一:博弈论和怪诞行为学属于什么学科 博弈论又被称为对策论,既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 问题二:博弈论是哪个专业学的 高等数学专业,经济学专业 问题三:有谁知道博弈论是大学里那个专业的必修课啊? 我们工商管理学院就是把博弈论做专业课的,工商管理、市场营销、财务管理专业都有这门课。 大概不同的大学安排略有不同,也可能是把博弈论作为专业任选课。 问题四:什么是博弈论? 博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈要素 (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。 (2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。 有了上述定义,就立即得到纳什定理: 任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。 纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。 纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。 但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。 塞尔顿(Ru30fbSelten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 博弈的类型 (1)合作博弈――研究人们达成合作时如何......>> 问题五:博弈论是怎样的一门学科 博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。 问题六:博弈论分哪几种啊?各自的优缺点是什么? 博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:囚徒困境就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型;以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。 问题七:博弈论是什么? 博弈论简介 (关键词:策略空间,合作博弈,非合作博弈,纳什均衡,团体理性,委托代理关系,激励理论) 博弈论(game theory)又称对策论,起源于本世纪初,1994年冯u30fb诺依曼和摩根斯坦恩合著的《博弈论和经济行为》奠定了博弈论的理论基础。20世纪50年代以来,纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。近20年来,博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到广泛的应用。 简单地说,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡。博弈论由3个基本要素组成:一是决策主体(player)?,又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(utility),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。参与人,策略集和效用构成了一个基本的博弈。 博弈论可以分为合作博弈和非合作博弈。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能,则称非合作博弈(non-cooperative game)?,非合作博弈是现代博弈论的研究重点。比如两家企业A、B合作建设一条VCD的生产线,协议由A方提供生产VCD的技术,B方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,A方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的“集体利益”,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。 合作博弈强调的是集体主义,团体理性(collective rationality),是效率、公平、公正;而非合作博弈则强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。 博弈论非常强调时间和信息的重要性,认为时间和信息是影响博弈均衡的主要因素。在博弈过程中,参与者之间的信息传递决定了其行动空间和最优战略的选择;同时,博弈过程中始终存在一个先后问题,参与人的行动次序对博弈最后的均衡有直接的影响。 博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识?信息是否了解两个角度进行。把两个角度结合就得到了4种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。其代表人物是纳什、泽尔腾和海萨尼。严格地讲,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故。博弈论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法。 利用博弈论可以证明现实生活中许多有趣的问题。如:多劳者不多得,公共资源的过度使用,非合作者在一段时间内选择合作坏人做好事。虽然这些结论都是建立在一个很强的假设,即参与人是理性的,有最大化自己效用的趋势。但是其结论有深刻的哲学内涵。 目前经济学中的委托――代理制、激励理论都可以用博弈论来分析。现代的企业间竞争有很多情况都是在合作的背景下进行的。比如垄断市场的寡头A、B,他们可以协议指定一个产量如海湾国家的石油产量,来维持自己的最大利润。但是在许多情况下总有为了维护自己的局部利润而提高产量的情况如沙特常擅自提高产量,结果导致价格下降,利润流失。竞争......>> 问题八:博弈论是什么理论? 博弈论的概念 博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支, 也是运筹学的一个重要学科。 博弈论的发展 博弈论思想古已有之,我国古代的《孙子兵法》 就不仅是一部军事著作,而且算是最早的一部博弈论专著。 博弈论最初主要研究象棋、桥牌、赌博中的胜负问题, 人们对博弈局势的把握只停留在经验上,没有向理论化发展, 正式发展成一门学科则是在20世纪初。1928年冯u30fb 诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。 1944年,冯u30fb诺意曼和摩根斯坦共著的划时代巨著《 博弈论与经济行为》 将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域, 从而奠定了这一学科的基础和理论体系。 谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《 n人博弈的均衡点》(1950),《非合作博弈》(1951) 等等,给出了纳什均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。 今天博弈论已发展成一门较完善的的学科。 博弈论的基本概念 博弈要素 (1)局中人:在一场竞赛或博弈中, 每一个有决策权的参与者成为一个局中人。 只有两个局中人的博弈现象称为“两人博弈”, 而多于两个局中人的博弈称为 “多人博弈”。 (2)策略:一局博弈中, 每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案, 一个局中人的一个可行的自始至终全局筹划的一个行动方案, 称为这个局中人的一个策略。 如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈” ,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。 每个局中人在一局博弈结束时的得失, 不仅与该局中人自身所选择的策略有关, 而且与全局中人所取定的一组策略有关。所以, 一局博弈结束时每个局中人的“得失” 是全体局中人所取定的一组策略的函数,通常称为支付( payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中, 均衡意即相关量处于稳定值。在供求关系中, 某一商品市场如果在某一价格下, 想以此价格买此商品的人均能买到,而想卖的人均能卖出, 此时我们就说,该商品的供求达到了均衡。所谓纳什均衡, 它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中, 所有的参与者面临这样一种情况,当其他人不改变策略时, 他此时的策略是最好的。也就是说, 此时如果他改变策略他的支付将会降低。在纳什均衡点上, 每一个理性的参与者都不会有单独改变策略的冲动。 纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“ 均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*, 局中人B也采取其最优策略b*,如果局中人仍采取b*, 而局中人A却采取另一种策略a, 那么局中人A的支付不会超过他采取原来的策略a*的支付。 这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A) 和策略b*(属于策略集B)称之为均衡偶,对任一策略a( 属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A) 和策略b*(属于策略集B)称为非零和博弈的均衡偶, 对任一策略a(属于策略集A)和策略b(属于策略集B),总有: 对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局......>>

博弈论是什么?

问题一:博弈论是什么?简单解释。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 问题二:博弈论的本质是什么? 博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论已经成为经济学的标准分析工具之一。 问题三:什么是博弈论? 博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈要素 (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。 (2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。 有了上述定义,就立即得到纳什定理: 任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。 纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。 纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。 但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。 塞尔顿(Ru30fbSelten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 博弈的类型 (1)合作博弈――研究人们达成合作时如何......>> 问题四:博弈论是什么理论? 博弈论的概念 博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支, 也是运筹学的一个重要学科。 博弈论的发展 博弈论思想古已有之,我国古代的《孙子兵法》 就不仅是一部军事著作,而且算是最早的一部博弈论专著。 博弈论最初主要研究象棋、桥牌、赌博中的胜负问题, 人们对博弈局势的把握只停留在经验上,没有向理论化发展, 正式发展成一门学科则是在20世纪初。1928年冯u30fb 诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。 1944年,冯u30fb诺意曼和摩根斯坦共著的划时代巨著《 博弈论与经济行为》 将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域, 从而奠定了这一学科的基础和理论体系。 谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《 n人博弈的均衡点》(1950),《非合作博弈》(1951) 等等,给出了纳什均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。 今天博弈论已发展成一门较完善的的学科。 博弈论的基本概念 博弈要素 (1)局中人:在一场竞赛或博弈中, 每一个有决策权的参与者成为一个局中人。 只有两个局中人的博弈现象称为“两人博弈”, 而多于两个局中人的博弈称为 “多人博弈”。 (2)策略:一局博弈中, 每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案, 一个局中人的一个可行的自始至终全局筹划的一个行动方案, 称为这个局中人的一个策略。 如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈” ,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。 每个局中人在一局博弈结束时的得失, 不仅与该局中人自身所选择的策略有关, 而且与全局中人所取定的一组策略有关。所以, 一局博弈结束时每个局中人的“得失” 是全体局中人所取定的一组策略的函数,通常称为支付( payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中, 均衡意即相关量处于稳定值。在供求关系中, 某一商品市场如果在某一价格下, 想以此价格买此商品的人均能买到,而想卖的人均能卖出, 此时我们就说,该商品的供求达到了均衡。所谓纳什均衡, 它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中, 所有的参与者面临这样一种情况,当其他人不改变策略时, 他此时的策略是最好的。也就是说, 此时如果他改变策略他的支付将会降低。在纳什均衡点上, 每一个理性的参与者都不会有单独改变策略的冲动。 纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“ 均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*, 局中人B也采取其最优策略b*,如果局中人仍采取b*, 而局中人A却采取另一种策略a, 那么局中人A的支付不会超过他采取原来的策略a*的支付。 这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A) 和策略b*(属于策略集B)称之为均衡偶,对任一策略a( 属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A) 和策略b*(属于策略集B)称为非零和博弈的均衡偶, 对任一策略a(属于策略集A)和策略b(属于策略集B),总有: 对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局......>> 问题五:博弈论是什么? 博弈论简介 (关键词:策略空间,合作博弈,非合作博弈,纳什均衡,团体理性,委托代理关系,激励理论) 博弈论(game theory)又称对策论,起源于本世纪初,1994年冯u30fb诺依曼和摩根斯坦恩合著的《博弈论和经济行为》奠定了博弈论的理论基础。20世纪50年代以来,纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。近20年来,博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到广泛的应用。 简单地说,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡。博弈论由3个基本要素组成:一是决策主体(player)?,又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(utility),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。参与人,策略集和效用构成了一个基本的博弈。 博弈论可以分为合作博弈和非合作博弈。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能,则称非合作博弈(non-cooperative game)?,非合作博弈是现代博弈论的研究重点。比如两家企业A、B合作建设一条VCD的生产线,协议由A方提供生产VCD的技术,B方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,A方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的“集体利益”,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。 合作博弈强调的是集体主义,团体理性(collective rationality),是效率、公平、公正;而非合作博弈则强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。 博弈论非常强调时间和信息的重要性,认为时间和信息是影响博弈均衡的主要因素。在博弈过程中,参与者之间的信息传递决定了其行动空间和最优战略的选择;同时,博弈过程中始终存在一个先后问题,参与人的行动次序对博弈最后的均衡有直接的影响。 博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识?信息是否了解两个角度进行。把两个角度结合就得到了4种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。其代表人物是纳什、泽尔腾和海萨尼。严格地讲,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故。博弈论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法。 利用博弈论可以证明现实生活中许多有趣的问题。如:多劳者不多得,公共资源的过度使用,非合作者在一段时间内选择合作坏人做好事。虽然这些结论都是建立在一个很强的假设,即参与人是理性的,有最大化自己效用的趋势。但是其结论有深刻的哲学内涵。 目前经济学中的委托――代理制、激励理论都可以用博弈论来分析。现代的企业间竞争有很多情况都是在合作的背景下进行的。比如垄断市场的寡头A、B,他们可以协议指定一个产量如海湾国家的石油产量,来维持自己的最大利润。但是在许多情况下总有为了维护自己的局部利润而提高产量的情况如沙特常擅自提高产量,结果导致价格下降,利润流失。竞争......>> 问题六:博弈论有什么用 天下没有一个人,敢说博弈论有什么用。就是相互忽悠,互相欺骗。 《博弈圣经》中《人类未知的蓝色档案》一文给出了博弈论的定义:“我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成三维均衡的语文学理论,称为博弈论。” 博弈圣经著作人说;博弈论是青年人的.毒.品,是无知者的兴.奋.剂,是沉默者的摇.头.丸。 博弈论 就是张冠李戴 捕风捉影 以讹传讹 《博弈圣经》【典故】讽刺博弈论的最高博弈水平 有人问博弈圣经著作人,什么是博弈论。 他回答说;博弈论就是,一问、二答、三无知。 也就是说;问者无知、回答者无知、听者更无知。 有人追问,到目前为止,那么多博弈论图书,那么多作者,他们的最高博弈水平是什么? 博弈圣经著作人一听就笑了;目前他们的最高博弈水平,就是想卖给你一本书,赢你一本书钱。 博弈圣经著作人通俗的谈;菜鸟与金鸟, 一个人想变得伟大,从一个菜鸟变成一个金鸟,就要利用国家实体特性造个金鸟笼。日后,就可以在媒体的报道中、绘声绘色地描述那个金鸟笼;他是某某大学院校、某某著名教授、某某首席科学家、某某诺贝尔奖得主、甚至某某 *** 官员,他就自然地钻进了金鸟笼。 弧弈论理论,它是太过于急躁、太过于草率的理论。由于博弈论新奇、古怪、原始,一个“囚徒困境”的三维谜团像似神话,人们又错误地认为博弈论能够取胜,因此受到了人们盲目的吹捧和疯狂的参与。人们把博弈取胜的欲望作为动力,一个人有了欲望,就要有实现欲望的对象和背景,加上自己行为的结果,才能取得想要的东西。博弈竞争的欲望在远古就出现了。欲望的天性就是进行交往,建立行为二特性对局,就是博弈的合作。 但明眼的人都能看得出,他抄来的无效理论编成的一本本博弈论,就是张冠李戴、捕风捉影、“以讹传讹”,不管他从外国哪个地方抄来的,不管他抄了多少、编了多少本书、多少篇文章,究其低劣的学术品质,他仍然是一个菜鸟。 假如博弈论大师,走出那个金鸟笼,再靠讲课赚大钱,靠卖书赚小钱,靠博弈取胜策略赚不到一毛钱,他就是骗子,也许是一个罪犯。 更为讽刺的是,一本本博弈论著作,古老的内容千篇一律,里面没有几句精彩的话,没有几个经典的词,更没有定理、定律、定义和法则。至今一个个博弈论专家、矛盾论专家、概率论专家和外行知道得一样多。 问题七:博弈是什么意思啊? 博弈是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程 博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。 在经济学上博奕论是个非常重要的理论概念。 问题八:博弈是什么意思 博弈原理是什么 资源是稀缺的,有限的,分配是根据博弈的结果来进行的 博弈原理是什么 证券市场是为资源优化配置服务的,本身并不创造利润,大多数人大多数时候投资是为了赚取买卖差价,这种博弈只是零和游戏。 零和游戏的规则是从整体和长期看输者输的数量等于赢者赢的数量。 但是由于有交易成本,实际上是负和博弈。 博弈又称对弈、对策,博弈原理说的是每个对弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,同时也要考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。也就是说,要在对方采取什么策略的估计基础上选择自己的恰当策略。 形成市场价格就必须有成交,成交意味着什么?成交意味着买卖双方形成了完全相反的价值判断。因此成交越容易越密集,则流动性越高,买卖双方完全相反的价值判断的对立程度也就越高。事实上造成了买卖双方的博弈。如果以差价为盈利模式,由于都要寻到买主和卖主才会成交,始点和终点仍以差价为盈利来源,这就形成一个开放的闭环,在这个环中赢者所赢得的数量必然等于输者所输的数量(如果忽略交易成本)。 金融市场有一假定,称“聪明人假定”。这个假定,说穿了并不稀奇,不过并不为大多数人所认同,其具体的内容可以表述为:“在金融市场里,‘聪明人"注定亏损。” “聪明人假定”符合大多数人的直感,但并没有其合理性的数据统计。不过,这个假定的最大功能,是彻底解释了金融市场的赢亏。 博弈问题,是当事人面对一定的来自他方的信息量选择最佳行动计划和最优策略问题。博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确骸的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择――坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当u30fb斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁―――3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,......>> 问题九:博弈论分哪几种啊?各自的优缺点是什么? 博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:囚徒困境就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型;以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。