纳什均衡

阅读 / 问答 / 标签

请问零和博弈最多只能有一个纳什均衡吗?

一次博弈最终总会形成一个结果,好比讨价还价,这就是博弈均衡。"纳什均衡"是一种最常见的、也是最重要的博弈均衡。它是美国天才数学家纳什在1950年正在攻读博士学位时提出来的,论文题为《n人博弈的均衡问题》。纳什巧妙运用数学技巧,证明了如下定理:对一任何一个n人参与的非合作博弈(零和或非零和),如果每个参与者的策略是有限的,那么一定存在至少一个纳什均衡解集。该论文只有短短一页纸,但却成了博弈论的经典文献,并使他获得了诺贝尔经济学奖。 "纳什均衡"的经典案例是"囚徒困境":两个作案嫌疑人分别关在两件牢房,警察告知,如果两人都招供,则各坐牢3年;如果两人都不招供,则放出;如果一人招供而另一人不招供,则招供的坐牢3年,不招供的坐牢10年。局外人看来,最好两人都不招供。但从每个人来看,招与不招的代价分别为{3;3}与{0;10},还是招供为好。 但从纳什均衡却得出一个悖论:单个人的最优选择却没有导致全局最佳的结果。现实中的例子很多,如价格战的结果是两败俱伤。"纳什均衡"证明了一个道理:非合作博弈的情况下困境无法解脱。纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。 纳什均衡经典案例:囚徒困境 (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。) 假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。 表2.2 囚徒困境博弈 —————————————————————————— ┃ B ┃ B ┃ ————————┃————————┃————————┃ ┃ 坦白 ┃ 抵赖 ┃ ————————┃————————┃————————┃ A 坦白 ┃ –8, –8 ┃ 0, –10 ┃ ————————┃————————┃————————┃ A 抵赖 ┃ –10, 0 ┃ –1, –1 ┃ ————————┃————————┃————————┃ 关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

纳什均衡的求解方法

纳什均衡的求解方法如下:纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。

什么是纳什均衡解?

其实呢,我只知道Nash balance,是老大跟我说的。原理他也没说,举例说吧,如果你喜欢一个女孩子,然后一直追不到她,那么就找几个朋友,把她身边的朋友们全部追走,那么你就有很大的可能追到那个女孩了。

纳什均衡是指什么?

纳什均衡是指纳什平衡,纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。扩展资料:纳什均衡的影响1、改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域。2、扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。3、形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。4、扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什平衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。参考资料来源:百度百科-纳什平衡

怎样解释纳什均衡的哲学意义

约翰·福布斯·纳什(John F. Nash, Jr.)是一位大帅哥,“如希腊古神一般英俊潇洒”[*] 。纳什人长得帅气,学问做得也很帅气;在一系列帅气的学术成果中,以他命名的“纳什均衡(Nash Equilibrium)”是最为帅气的。纳什均衡是非合作博弈论中最重要的一个概念,它给出了非合作博弈分析的解的一般概念;纳什均衡在非合作博弈分析中雄踞着核心的角色,发挥着关键的作用。为什么会有这样的角色和作用呢?我们需要了解她的哲学意义。从哲学上,如何理解纳什均衡呢?让我们设想多个参与人在博弈展开之前协商达成一个协议,规定每个参与人选择某一特定的策略。现在,我们要问的一个问题是,在博弈真正展开之后,参与人会真实地履行之前协商达成的协议呢?换句话说,假定其他参与人都真实地履行诺言,在没有任何外在强制的情况下,任何参与人都有积极性去履行自己的诺言吗?显然,只有在一种情况下,参与人才有积极性去履行自己的诺言;这种情况就是,履行诺言所获得的得益大于食言所获得的得益。在契约经济中,如果没有任何参与人有积极性去破坏协议,我们就说这个协议是可以自我强制的(self-enforcing)。也就是说,如果一个协议是可以自我强制性的,那么参与人是没有积极性去食言、去违约的。在纳什均衡中,每个参与人都无法通过单独改变自己的策略而获得额外利益;在纳什均衡中,给定其他参与人的策略的前提下,每个参与人的策略都是最优反应策略。换一种说法,在纳什均衡中,没有任何参与人有积极性去选择其他策略。从这个意义上讲,如果把纳什均衡看成是一个协议,那么这个协议是可以自我强制的。纳什均衡是可以自我强制的,这就是纳什均衡所体现出来的最为深刻的哲学意义。用一句不太令人舒服的话来讲,纳什均衡就是一种“僵局”:给定其他参与人不动的情况下,没有任何参与人有兴趣动[u2020] 。纳什均衡是可以自我强制的,也称为具有“一致预测性”。在这里,“一致预测性”指的是:如果所有参与人都预测特定的博弈结果会出现,那么所有参与人都不会利用该预测或这种预测能力选择与预测结果不一致的策略[u2021] 。预测是博弈分析的最根本目的之一;我们之所以要进行博弈分析,最根本目的之一就是预测博弈将会出现什么样的结果。因此,一个博弈分析概念的作用和价值,很大程度上是由她对博弈结果的预测判断的能力为基础的。不具有一致预测性的博弈分析概念,在分析和预测博弈结果时,难以避免预测和行为之间的矛盾;任何参与人在博弈中所作预测的内容包含着她自己的选择,她有可能会利用预测改变自己的选择。因此,如果博弈分析概念不具有一致预测性,不是可以自我强制的,这个概念就是不稳定的,甚至是自我否定的,其作用和价值必然有限,就不可能成为具有普遍意义的博弈分析概念。纳什均衡具有一致预测性,是可以自我强制的,这正是她具有预测能力的基本保证。正是由于纳什均衡是一致预测的,是可以自我强制的,因此才能进一步地具有如下性质:任何参与人都可以预测它,可以预测她们的对手会预测它,还可以预测她们的对手会预测自己会预测它…..。不多罗嗦了,千言万语汇成一句话:纳什均衡具有一致预测性,是可以自我强制的,这就是她所体现出来的最为深刻的哲学意义,也是她在非合作博弈分析中具有不可替代重要地位的根本原因之一。

请问有谁能为我具体解释一下“纳什均衡”吗?

名称来源及简介:  纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。

什么是纳什均衡?

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

纳什均衡是什么?

纳什均衡是指纳什平衡,纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。扩展资料:纳什均衡的影响1、改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域。2、扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。3、形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。4、扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什平衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。参考资料来源:百度百科-纳什平衡

什么是纳什均衡纳什均衡定义及描述 什么是纳什均衡

1、纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 2、约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。    3、纳什的主要学术贡献体现在1950年和1951年的两篇论文,1950年他才把自己的研究成果写成题为“非合作博弈”的文章刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低,嘲笑几天之后,他遇到盖尔,像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理找到了普遍化的方法和均衡点。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从没想到学术欺骗的后果。结果还是戴维·盖尔充当了他的“经纪人”,起草致科学院的短信,系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院。纳什写的文章不多,他辩解说:少了才是精品。中国国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。  4、1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。    5、Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。 6、假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 纳什均衡 7、最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。    8、纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。

假设两个人在玩博弈论,每个人有2个纯策略。问题是这个博弈论最多有几个纯策略纳什均衡?最少有多少个?

最多4个pure,最少0个pure。最多4个,选什么都一样就是4个,比如无论两人选什么,每个人的payoff都是0。那么每一组pure都是纳什均衡。(如果强制要求每个payoff都不一样,那么最多是2个。)最少0个。例如两个人选择Yes或No,Player1是和对方一样时payoff为1,不一样时payoff为-1;Player2反之,和player1一样时payoff为-1,不一样时payoff为1。这个就不存在pure纳什均衡。只有一个mix纳什均衡,两个player都半半的几率选择yes和no。

什么是纳什均衡?

通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。在纳什均衡中,每一个理性的参与者都不会有单独改变策略的冲动。处类似“囚徒困境”这样的博弈中,背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡结果,就是双方参与者都背叛对方。试想一个简单的博弈,张三和李四这两个员工都想要加薪。假如只有一个员工要求加薪,老板会答应:但要是两个人都要求加薪,老板就会生气,并把两个人统统开除。这场博弈有两个纳什均衡,一个是只有张三要求加薪,另一个是只有李四要求加薪。两个员工都不要求加薪并不是纳什均衡,因为当两个人知道对方没有提出要求时,就会后悔自己的选择。两个人都要求加薪也不是纳什均衡,因为两个人事后都会后悔自己被开除。稳定而自私的结果,就是一个纳什均衡。

如何达成纳什均衡?

纳什认为,一个可行的方法是所有局中人进行直率的谈判。我们并不能保证局中人会达成一致,也无法说会达成何种一致;但是,若达成的一致是上述自我强迫型的,则一定是一个均衡,而且是纳什均衡中的一个集合。

纳什均衡

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

纳什均衡的重要影响

纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费"近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给"和‘需求"”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡"”。

博弈论纳什均衡?

  纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。  纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。  假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1] ),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。  纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

纳什均衡是不是帕累托均衡?

长文“帕累托最优处处满足吗?”中的一部分:帕累托最优与纳什均衡是不同的。譬如,“囚徒困境”是博弈论(或称对策论、赛局理论)中经常使用的一个理论分析模型。该模型说的是,甲和乙合伙抢了银行,被抓获。他们被关进分隔的牢房。检察官分别告诉他们:如果两人都不坦白,他们会因非法携带枪支的罪名各判刑1年;如果其中一人招供而另一人不招供,坦白者作为证人将不会被起诉,另一人将会被重判10年徒刑;如果两人都招供,则两人都会以抢劫罪名各判5年徒刑。结果,两个人都招供了。在博弈论中,这种结果是一种纳什均衡,即给定别人策略的情况下,没有任何单个局中人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡。在上述囚徒困境模型中,如果甲相信乙招供,那么他的最佳策略是招供,而如果乙相信甲招供,那么他的最佳策略仍是招供。这就是一个纳什均衡,它是“自确定”的。但是,这个纳什均衡不是帕累托最优。在经济学上,帕累托最优指的是:在给定现有资源条件下,不存在任何其他配置结果使某些人情况更好,而又不使任何其他人处境更坏。显然,在上述囚徒困境模型当中,甲乙两个人都从理性的角度出发,追求自身效用的最大,结果是双方不合作,都认罪了。也就是说,实现了纳什均衡。但是,如果甲与乙合作,产生的结果要比双方不合作好得多。也就是说,如果双方合作,就存在帕累托改进(帕累托改进是指一种变化,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。帕累托改进是达到帕累托最优的路径和方法)。那么,为什么两人不敢合作呢?甲会这样推理:“假如乙不招供,我只要一招供,立即可以获得自由,而不招供却要坐牢1年,显然招供比不招供好;假如乙招供了,我若不招供,则要坐牢10年,招供了只坐5年牢,显然还是招供的好。可见,无论乙招供与不招供,我的最佳选择都是招供。”同理,乙也会如此推理。于是,谁也不敢选择合作。所以,在囚徒困境这个模型当中,从个人的理性出发,推导不出帕累托最优。由此可见,纳什均衡只是一种平衡,而不是一种帕累托最优,不是一种完美的结局。

简述纳什均衡对策意义

  纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。  假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。  纳什均衡经典案例:囚徒困境  (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)  假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。  表2.2 囚徒困境博弈  ——————————————————————————  ┃ B ┃ B ┃  ————————┃————————┃————————┃  ┃ 坦白 ┃ 抵赖 ┃  ————————┃————————┃————————┃  A 坦白 ┃ –8, –8 ┃ 0, –10 ┃  ————————┃————————┃————————┃  A 抵赖 ┃ –10, 0 ┃ –1, –1 ┃  ————————┃————————┃————————┃  关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。  基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。  记载纳什生平的书有:《普林斯顿的幽灵》(又译为《美丽心灵》)西尔维娅.娜萨

纳什均衡指什么,谁提出的?

纳什均衡理论又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略。则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料纳什均衡理论创始人约翰·纳什介绍——1928年6月13日—2015年5月23日,提出纳什均衡的概念和均衡存在定理,是著名经济学家、《美丽心灵》男主角原型,前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。参考资料来源:百度百科——纳什均衡

纳什均衡点怎么找

1.纯策略:划线法 (4,1) (3,0) (3,2) (7,3) 每个括号第一个数为Player1的收益,第二个数为Player2的收益. 当局中人2选择策略1时,比较纵向两个括号内第一个数,可知局中人1最大收益为4,在4下划线 当局中人2选择策略2时,同上,可知局中人1最大收益为7,在7下划线 当局中人1选择策略1时,比较横向两个括号内第二个数,可知局中人2最佳收益为1,在1下划线 当局中人1选择策略2时,同上,可知局中人2最大收益为3,在3下划线 所以有纯策略那是均衡,双方都取策略1或双方都取策略2 (4,1)及(7,3) 混合策略:方程组法 4y1+3y2=3y1+7y2 1x1+2x2=0x1+3x2 (这是两个方程组,这里打不出大括号……) y1+y2=1 x1+x2=1 y1=2/5 ,y2=3/5 x1=1/2 ,x2=1/2 X*=(1/2,1/2) Y*=(2/5,3/5)为混合策略下的那是均衡 我自己算的,仅供参考~

纳什均衡的数学定义 我百度里查的到 但是不是很能理解 谁能解释一下 因为我要做一个关于纳什均衡在

不会。

纳什均衡是谁提出的?

就是纳什本人 约翰·福布斯·纳什(John Forbes Nash Jr)1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。

什么是纳什均衡

纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。参考资料来源:百度百科-纳什平衡

什么是纳什均衡?

纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。”也就是说,所有人的战略都是最优的。而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。a,b面临抉择。显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。

所有博弈都存在纳什均衡吗?

不是所有博弈都存在纳什均衡 如纯策略就不存在混合策略则一定会存在纳什均衡 它是通过概率来计算纳什均衡在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。

什么是纳什均衡?什么是纳什均衡的一致性预测

纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1] ),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

让你彻底明白,什么是纳什均衡

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名,是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡可以分成两类:"纯战略纳什均衡"和"混合战略纳什均衡"。纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。

什么是纳什均衡,有何作用?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡

什么是纳什均衡

纳什平衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

纳什均衡是什么意思?

纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。”也就是说,所有人的战略都是最优的。而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。a,b面临抉择。显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。

什么是纳什均衡 纳什均衡定义及描述

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名. 约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学.其研究成果见于题为《非合作博弈》(1950)的博士论文.该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表.纳什在上述论文中,介绍了合作博弈与非合作博弈的区别.他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈.该解概念后来被称为纳什均衡. 纳什的主要学术贡献体现在1950年和1951年的两篇论文,1950年他才把自己的研究成果写成题为“非合作博弈”的文章刊登在美国全国科学院每月公报上,立即引起轰动.说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低,嘲笑几天之后,他遇到盖尔,像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理找到了普遍化的方法和均衡点.纳什这个初出茅庐的小子,根本不知道竞争的险恶,从没想到学术欺骗的后果.结果还是戴维·盖尔充当了他的“经纪人”,起草致科学院的短信,系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院.纳什写的文章不多,他辩解说:少了才是精品.中国国内提一个教授,要求在“核心的刊物”上发表多少篇文章.按照这个标准可能纳什还不一定够资格. 1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法. Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况.Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在.以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖.于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡.类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等. 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 纳什均衡 最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化.所有局中人策略构成一个策略组合(Strategy Profile).纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成.即在给定别人策略的情况下,没有人有足够理由打破这种均衡.纳什均衡,从实质上说,是一种非合作博弈状态. 纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的.纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子.

谁知道纳什均衡定律是什么定律?

诺贝尔奖的人都要与瑞典国王有15分钟的交谈,他怕纳什会说错话,但纳什已经完全从精神分裂症中走了出来,他很好的与国王交谈了15分钟,2002年他还曾经来过中国参加世界数学家大会的博弈论分会。他说他要加倍努力,把逝去的几十年时间给补回来。直到现在,纳什均衡存在定理依旧是博弈论中最重要的定理之一。其实除了纳什本人,能在他患了精神分裂症的几十年中一直收留他关心他的普林斯顿大学也是很值得赞赏的,普林斯顿是世界最顶尖的大学之一,好像前年还超过了哈佛排名世界第一吧!普林斯顿最可贵的是以宽容的胸怀来对待每一位学者。像纳什这样的几十年没有发表一篇论文的学者在国内可能早就被扫地出门了,在如今这个充满浮躁年代,大学也不能免俗,无休止的论文数是一切回报的基础,中科院研究员李淼在其《弦论通俗演义》中的开篇第一句话便是:“作为科学院的研究员,似乎唯一的正业是写SCI 论文。”这是不是一个悲哀我不得而知,但普林斯顿确实出了些这样我们眼里不务正业的人,普林斯顿大学的怀尔斯教授面壁十年,销声匿名,无一字论文发表,但不鸣则已,一鸣惊人,1997年终于破解了350年来无人能解的费马大定律。爱因斯坦移居美国后就一直呆在普林斯顿长达20年,陈景润在世时也曾经说过,他最想去的地方就是普林斯顿。普林斯顿大学高等研究院更是被推为学术研究的典范。  竞争,有时确实能够起到激励作用,使大家奋发努力,但当代心理学及行为经济学的研究表明,过度的竞争对于创造力可能更多的是抑制作用。大师的诞生可能需要更多的包容和宽容,而不是像赶马一样一味的用鞭子抽打使其加快奔跑的速度……  幽默点评:想想你和你MM之间微妙的关系就知道了,竞争与合作是人与人之间交往的两个基本模式,嘻嘻!  大洪水  画家:米开朗基罗生于 意大利(1475-1564)  看着这些由于受磨难而表情滞重的人物向前行进,我们几乎能听到狂风摇撼树枝时的呼啸,几乎能感觉到上帝愤怒时的恐怖气氛;当人们面临大洪水这样的灾难时,有些人互相帮助寻求求生的合作,而有些人则相互竞争寻求仅有的求生工具;人总是在既寻求合作,又不得不面对竞争的环境中求生、存活,这就是博弈,人和人之间互动。  普林斯顿大学经济学教授鲁宾斯坦在《博弈论教程》中说道:  “博弈论是一个分析工具包,他被设计用来帮助我们理解所观察到的决策主体相互作用时的现象。这种理论隐含的基本假设是:决策主体追求确定的外部目标(他们是理性的),并且考虑他们自身的知识或其他决策主体行为的期望(他们推理具有战略性)。博弈论模型是对各种现实生活状况的高度抽象概括。这种抽象性使得它们可被用来研究范围很广的现象。博弈论使用数学来正式地表达他的思想。然而,我们所讨论的博弈论思想却不是生来就带数学味的。从原理上讲,不使用数学,也完全可以写一本与教材 内容基本相同的著作。数学形式使得精确的定义概念变得比较容易,可以验证思想的一致性,还可以探求假设的内涵。”

纳什均衡是什么意思?

纳什均衡理论又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略。则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料纳什均衡理论创始人约翰·纳什介绍——1928年6月13日—2015年5月23日,提出纳什均衡的概念和均衡存在定理,是著名经济学家、《美丽心灵》男主角原型,前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。参考资料来源:百度百科——纳什均衡

纳什均衡是什么?

纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。参考资料来源:百度百科-纳什平衡

博弈树怎么看纳什均衡

博弈树看纳什均衡:纳什均衡和逆向归纳策略都是同一个,即与支付向量(1,3)相应的策略组合(决策1,决策3)。博弈树探讨一下难度较大的棋类游戏程序,用这些程序来同人或其他程序对弈。有些程序是把计算机精心设计成一个棋盘,人们可以在其上对弈。这种程序更接近于系统模拟的领域,而不属于人工智能的范畴。此处所要介绍的却是让计算机能够“思考”如何下棋。简介纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。

什么是纳什均衡,怎样达到纳什均衡

纳什均衡,Nash equilibrium,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1] ),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

什么是纳什均衡

博弈圣经著作人的经典名句;博弈圣经著作人把“纳什均衡”戏称为“傻吊博弈的图腾”。博弈圣经著作人的经典名句;傻吊谈博弈,必谈纳什均衡。博弈圣经著作人的经典名句;“纳什均衡”的本质,是对中国人的发现、发明、创造精神的一种羞辱。来源:美国资讯网;博弈圣经著作人对纳什的嘲讽博弈圣经著作人的经典名句;0、1、二维平均,称平衡,0、1、2、三维平均,称均衡。在0、1、二维记录的系统中,有一个冯·诺依曼极小极大定理,0、1、二维系统就不存在平均律,就是不存在均衡,纳什均衡当时就遭到冯·诺依曼的贬低、嘲笑和断然否定。谈到“纳什均衡”,有位记者请纳什用通俗的语言来解释他的理论。纳什说;“‘纳什均衡"并不高深,它就像中国人发明的一种、三个人玩的扑克游戏,“纳什均衡”就是一个简单的三人博弈游戏”。中国有那么多人玩扑克,又玩了那么多年,纳什均衡还提醒了中国人半个多世纪,中国人竟没有一个人发现三个人玩的扑克游戏中、还有‘均衡占优理论"。人们不禁要问;纳什他自己玩过几次中国的三人扑克游戏?他和谁玩的?他是怎么发现的均衡?均衡理论又是怎么单方占优的?他为什么没有了下文。博弈圣经著作人的经典名句;科学家在纳什均衡理论中、尚未发现博弈占优策略的任何迹象。在纳什的语文学中,就没有出现过一次0、1、2、三维均衡的概念,纳什均衡哪里来。博弈圣经著作人的经典名句;纳什均衡理论没有任何明确的说法,纳什均衡是美国伪造的产物,传到了世界各地,当然也传遍了中国。“纳什均衡”的本质,是对中国人的发现、发明、创造精神的一种羞辱。博弈圣经著作人的经典名句;二维平衡是指生物的竞争行为,三维均衡是指自然的优劣特性。博弈圣经著作人的经典名句;揭开纳什均衡的画皮,露出真相。【如果纳什均衡是以纳什的名字、命名的一个博弈论术语;假如我把纳什名字去掉、只剩下均衡一词、均衡也就是纯净的博弈论术语;倘若所有博弈论的文章中、都把纳什名字去掉只剩下均衡;再读一篇篇博弈论文章、也都是围绕着均衡一词展开的叙述;发现通篇文章逻辑不通、词意变异、不知所云;只要是属于纳什均衡的理论文章、去掉纳什名字之后、纳什的鬼魅就出现了;通篇文章,捕风捉影、张冠李戴、以讹传讹,添油加醋又像是疯言疯语,更不能被常人所理解。】博弈圣经著作人的经典名句;纳什-是纳什,均衡-是均衡。博弈圣经著作人的经典名句;“纳什均衡” 之所以鬼魅,纳什自己不知道什么是纳什均衡,追随他的门外汉,都假装懂得纳什均衡。“纳什均衡”把所有的门徒变成了精神病、变成了不懂装懂;任何人谈到纳什均衡,就像掉进了魔鬼坑,开口就是自问自答、自说自话、反复无常、自己感到莫名其妙时,还会自圆其说。纳什均衡是什么,纳什自己不知道,中国的傻吊全都知道……。博弈圣经著作人的经典名句;纳什均衡是一份内容不明的谜语,它似乎和任何可理解的逻辑语言都对不上。博弈圣经著作人把“纳什均衡”戏称为“傻吊博弈的图腾”。博弈圣经著作人的经典名句;如果说纳什均衡是一份学术遗产,那就是学术中、独一份的滑稽遗产,他的滑稽级别、足够七星级。博弈圣经著作人的经典名句;“纳什均衡成了中国的一个宗教,追随他的门徒;有无知的青年、有无畏的傻吊、还有无耻的教授。”博弈圣经著作人的经典名句;傻吊谈博弈,必谈纳什均衡。博弈圣经著作人的经典名句;中国人醒来吧,应该扪心自问;“纳什均衡”理论在哪里?中国人从“纳什均衡”中、学到了什么?纳什演示“纳什均衡”的数学符号,是用某些简单的游戏规则、重组了一些毫无意义的符号,也是纳什均衡在被逼无奈时、在纸上进行的符号游戏。博弈圣经著作人的经典名句;【“纳什均衡”一词,像是宗教的“圣言”,追随它的门徒,各自像精神病人一样、在纳什均衡中寻找理由,都想找到合理的理由解释“纳什均衡”,其结果把纳什均衡变成了博弈宗教、纳什变成了教主,门徒解释纳什均衡的疯言疯语,其实就是胡说八道。】博弈圣经著作人的经典名句;如果中国的教授抄袭“纳什均衡”作为标题,捕风捉影、以讹传讹的炒作,是为了编书、售书、挣钱,假如读者想通过“纳什均衡”想占优、想赢钱,就应该先查查纳什50年以来讲过一句“赢钱”吗,他赢过一次吗?因为没有在赌场中验证,他受到了爱因斯坦的冷遇。【纳什既然是个数学家,他就应该把占优策略给出一个数字量化的数学公式、或者是一个数学模板,让所有的人都能成功模仿,也就是说都能赢。科学的有效性,就应该像打电话一样,只要给出一个电话号码,任何人有序的按下按键,都能打通电话。炒作半个多世纪的纳什均衡,什么非合作博弈策略,什么博弈占有策略,竟然没有一个人能赢,实在是荒唐。】博弈圣经著作人的经典名句;科学家的博弈功能,是让其傻吊与天才同等水平。人们等到纳什车祸身亡、全无博弈取胜的结果,历史证明他就没有所谓的占优策略。“纳什均衡”它会是什么?它像UFO一样诡异、令人百思不解。“纳什均衡”的鬼魅让人想入非非,层出不穷的解释让人匪夷所思。1958年,从《财富》杂志对纳什的炒作,把纳什评为新一代天才数学家中、最出色的人物之后,纳什就迅速赢得了荣耀。他到处讲学、演说,与各国大牌数学家会面,事业如日中天。博弈圣经著作人的经典名句;电影《美丽心灵》用构思、杜撰的艺术形式、编造了纳什戏剧性的一生,“纳什均衡”像西方宗教的“经文”一样,演变成了博弈宗教传奇。诺贝尔经济学奖意外地、砸到纳什头上的那种巧合,给了纳什幸运的一生、羞羞答答的一生、不愿见人的一生、学术欺骗的一生、也是他难堪的一生。博弈圣经著作人的经典名句;纳什均衡是半个世纪前,一个“驴头不对马嘴”的概念,纳什之所以一直沉默,是因为他没法说,他不敢说,他到死都不会说。【来源:美国资讯网;麻省理工福布斯纳什-著名大学名人-正文-时间:2013-12-02,从博弈圣经著作人对纳什的嘲讽,到纳什2015年5月23号出车祸死亡,中间有一年半时间他没有作出回应。】博弈圣经著作人的经典名句;纳什均衡,是黑暗中的教唆、无知中的误判、猎奇中的杂耍。博弈圣经著作人的经典名句;几个(因为博弈论)获得诺贝尔经济学奖的得主、管理股票的炒股公司,因亏空、也关门大吉了。瑞典皇家科学院、诺贝尔经济学奖委员会委员,斯塔尔说;纳什均衡是一个博弈取胜的幻想,他自己也不知道怎么均衡、不知道怎么单方占优、不知道怎么取胜。因此,纳什在世期间不会向世人做出博弈如何取胜的解释,所以他一直保持沉默。斯塔尔还说;我们今天既然把纳什均衡带到公众面前,可以断定,未来一定会出现博弈的取胜理论,大家担心纳什均衡可能一败涂地,若干年后将变成一大丑闻。来源:美国资讯网;麻省理工福布斯纳什-著名大学名人-正文-时间:2013-12-02博弈圣经著作人对纳什的嘲讽......。纳什均衡 以讹传讹 是什么玩意儿 博弈论理论 是停滞不前的理论博弈圣经著作人笑谈博弈论,人们在寻找一粒爆香的黄豆时,还不如老鼠能选择最近的路程。《博弈圣经》中《人类未知的蓝色档案》一文给出了博弈论的定义:“我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成三维均衡的语文学理论,称为博弈论。”博弈圣经著作人说;博弈论是青年人的毒品,是无知者的兴奋剂,是沉默者的摇头丸。博弈圣经著作人对博弈、宗教、伟人,有过美妙的阐述 博弈圣经著作人说;博弈是人与宇宙的宗教。博弈的使命是探索自然界里和思维世界里,所显示出来的崇高、庄严、不可思议的秩序。人们对宇宙,实体、知识、未知的神秘,以及对个体,性质、经验、已知的恐惧——产生了宗教。人们认识到,有些为我们所不能洞察的东西存在其中,感觉到有一种最原始的形式、最深奥的理性、最灿烂的壮美、所产生的博弈情感,构成了真正的宗教感情。没有宗教、没有信仰、没有博弈感情,就不会出现时代伟人。博弈论就是张冠李戴捕风捉影以讹传讹 【典故】讽刺博弈论的最高博弈水平;有人问博弈圣经著作人,什么是博弈论。他回答说;博弈论就是,一问、二答、三无知。也就是说;问者无知、回答者无知、听者更无知。有人追问,到目前为止,那么多博弈论图书,那么多作者,他们的最高博弈水平是什么?博弈圣经著作人一听就笑了;目前他们的最高博弈水平,就是想卖给你一本书,就想赢你一本书钱。博弈圣经著作人通俗的谈菜鸟与金鸟一个人想变得伟大,从一个菜鸟变成一个金鸟,就要利用国家实体特性造个金鸟笼。日后,就可以在媒体的报道中、绘声绘色地描述那个金鸟笼;他是某某大学院校、某某著名教授、某某首席科学家、某某诺贝尔奖得主、甚至某某政府官员,他就自然的钻进了金鸟笼。博弈论理论,是停滞不前的理论,它是太过于急躁、太过于草率的理论。由于博弈论新奇、古怪、原始,一个“囚徒困境”的三维谜团像似神话,人们又错误的认为博弈论能够取胜,因此受到了人们盲目的吹捧和疯狂的参与。人们把博弈取胜的欲望作为动力,博弈竞争的欲望在远古就出现了。一个人有了欲望,就要有实现欲望的对象和博弈对局的背景,加上自己行为的结果,才能取得想要的东西。欲望的天性就是进行交往,建立行为二特性对局,就是博弈的合作。 《博弈圣经》赢的定义;赢不是大小、不是多少、不是均衡平衡、不是战略战术,而是在未来国正论的0、1、2,三维随机状态中,一粒期望的粒子(常数0.007813,也是私湍边际效应)优先达成。赢也不是福,输也不是罪,输赢与均衡属于第三空地论的内容。但明眼的人都能看得出,所谓那些自称的博弈专家抄来的无效理论、编成的一本本博弈论,就是张冠李戴、捕风捉影、“以讹传讹”,不管他从外国哪个地方抄来的,不管他抄了多少、编了多少本书、多少篇文章,究其低劣的学术品质,他仍然是一个菜鸟。假如博弈论大师,走出那个金鸟笼,再靠讲课赚大钱,靠卖书赚小钱,靠博弈取胜策略赚不到一毛钱,他就是骗子,也许是一个罪犯。更为讽刺的是,一本本博弈论著作,古老的内容千篇一律,里面没有几句精彩的话,没有几个经典的词,更没有定理、定律、定义和法则。至今一个个博弈论专家、矛盾论专家、概率论专家和外行知道得一样多。以往经济学家为了降低风险,建议投资多元化,“不要把鸡蛋放在一个篮子里”,这种分散投资的经济思想,实在是经济学家对博弈取胜的无奈。《博弈圣经》在453节有一段风趣的表述:“我们根本不能完全理解大自然,或许人们不如老鼠在寻找食物时能选择最近的路程,那是大自然的拓扑几何图像的捷径。”看看权威媒体上发表的理论文章,标题或者落款,都是什么什么单位(一个金鸟笼)、某某某人的大名(一个金鸟),即使有一个金鸟笼做背书、做包装,再看他那排列整齐错落有致的垃圾文章,如果只看外观不读内容,真像是一篇好文章,假如读者直接读内容,就会得出结论;文章的段子就是破碎的八卦、文章的内容就是拼凑的垃圾、金鸟笼就是忽悠人、金鸟其实就是一个菜鸟。中国新领导人形容过“笼子政治”的概念,因此中国就是一个笼子政治,金鸟笼里豢养了很多菜鸟,(政治菜鸟、经济菜鸟、学术菜鸟、司法菜鸟、还有博弈论菜鸟等)。他们给中国百姓制造了无数的罪恶,中国百姓很善良,面对东方暴力机器,强权暴力,强权学术,都忍了……。【新领导人说;把权力关进笼子里,就是要把菜鸟的权力关进笼子里……。】......。《博弈圣经》给出的一部分定义博弈圣经著作人说;每一个定义,都是一种逻辑语言,里面一致性的逻辑结构清晰可辨,只是人们以前从没真正看懂过。《博弈圣经》纳什均衡的定义;纳什均衡,是黑暗中的教唆、无知中的误判、猎奇中的杂耍。《博弈圣经》预测的定义;只有对每一个粒子相邻的未来状态、作出“大与小” 或‘多与少"的数字化判定,才称其为预测。《博弈圣经》预言的定义;在一个事件或若干个事件未发生之前的一段时间内、对某一状态的结果,给出命题公理化的语言判定,才称其为预言。《博弈圣经》政治的定义:我们把统治者模仿大自然博弈实体的秩序,外在于个体的一个整体结构,称为政治。《博弈圣经》实体政治的定义;一人为粒子、二人为病毒、三人为“私湍”,它们共同组成了、像似实体政治的幻象。(二人为“一株寄生”病毒、三人为团伙“私湍” )《博弈圣经》博弈实体政治的定义:我们把统治者模仿大自然博弈实体的秩序,外在于众多个体的平等性质、用文化私湍规矩与实体法则建立的笼子机构,称其为博弈实体政治。《博弈圣经》博弈实体外交的定义;我们在国际外交关系中,平等、互信、包容、合作、共赢的精神,看成博弈实体外交。《博弈圣经》外交的本质定义;外交不是交易、外交不是科学、外交的博弈结果,是徘徊在双方第三空地里的教训。《博弈圣经》经济的定义;经济,就是不断地对0、1、2、三维状态的熵区分。《博弈圣经》经济学的定义;经济学是输赢与均衡在公共空间里的概念。《博弈圣经》经济学家的定义;经济学家就像赌场中一个个旁观输赢的马仔,围绕着博弈实体经济学的理论,凭个人临时的感觉,谈输、谈赢、谈均衡。《博弈圣经》博弈实体经济学的定义;我们把博弈实体分离不变性学说,能容得下宏观经济实体与微观经济性质的语文学通论,看成博弈实体经济学。《博弈圣经》实体经济的定义;我们把飞秒瞬间看到的天、地、人、事、物、情感的抽象概念融合在一起,在没有时间概念的场景中,形成的一个个金融特性的文化私湍,称其为实体经济。《博弈圣经》虚拟经济的定义;犹如看魔术大师让一群狗争夺一块骨头,让众人押注的赌博游戏。《博弈圣经》金融的定义;我们感受到的“金钱宗教”与‘金钱神学",在天、地、人的情感中,用虚无的谎言进行类似于物品概念的买卖与交换,称其为金融。《博弈圣经》金融经济的定义;我们在飞秒瞬间看到的天、地、人之间,人们用情感和虚无的谎言,进行类似于物品概念的买卖、流通、产生利息的货币交换,称其为金融经济。《博弈圣经》金融犯罪的定义;我们把金融单位看成私湍,把私湍的实体与性质看成两重天;金融单位都有共同的理想、共同的欺骗;法定允许欺骗的欺骗、就是金融秩序;法定没允许欺骗的欺骗、就是金融犯罪。《博弈圣经》经济神学的定义;博弈圣经著作人把股民炒股的神秘性,把股评家传教炒股的童话、人话、鬼话、神话,称其为荒唐的经济神学。《博弈圣经》发明家的定义;发明家就是意见的推翻者、行为的摧残者。《博弈圣经》哲学的定义;我们把文化中,借助国正论的语文学反映,定义为哲学。《博弈圣经》科学的定义;文明的永恒、普适、唯一性,就是科学。《博弈圣经》精神的定义;我们把主体的瘾魂,用气质、自由合成的唯一个性,看成精神。《博弈圣经》科学精神的定义:用盲从在道德与博弈混合的概念里,执着于终极正理的唯一理性,看成是科学精神。《博弈圣经》禅的定义;禅是第三空间里飘荡的一个“神化迈迈”。《博弈圣经》文明的定义;文化进程里恩怨游戏的终结就是文明。《博弈圣经》工作的定义;唯独用这一物改变成那一物的创作形式,才称其为工作,才能预知结果。《博弈圣经》实体社会的定义;文化是政治的灵魂,政治是知识论的母体——博弈实体,它构成了实体社会。《博弈圣经》文化的定义;我们把脱离大脑的感觉、思维、意识、观念,向主观、理性、真理,一级一级的私湍增量,称为文化。《博弈圣经》内涵的定义:是主体里的瘾魂、气质、个性、精神被我们用情感的概念,创作出来的一切属性之和。《博弈圣经》实体与性质的定义;博弈实体的可分不变性是博弈的性质,凡是与实体能分离的就是性质,凡是与实体同在的就是实体。《博弈圣经》金融企业的定义;实体与性质的理论学说告诉我们,由政府批准(实体特性)的团伙欺骗行为、属于金融企业,由警局找到未被政府批准(个体性质)的金融企业、属于经济咋骗团伙。《博弈圣经》法律的定义:法律是一个实体特性与两个灵性的结合,是实体分离不变性学说。《博弈圣经》司法均赢力的定义;法律加上情感的行为能在两个灵性的精神上产生双赢的感觉,我们把发展双赢的能力,称为——司法均赢力。《博弈圣经》和谐司法精神的定义;实体法则对待当事人可以像股价一样随时间向空间膨胀,让当事人的精神上在司法中找到赢的感觉,这就是——和谐司法精神。《博弈圣经》中国梦的定义;让人民体面的劳动、自由的创造、有尊严的活着、找到赢的感觉,这就是中国梦的标志性内容。《博弈圣经》公正的定义;公正是非自愿与高兴之间的均赢。《博弈圣经》幸福的定义;信任并自由地给予和欲意的收入,定义为幸福。《博弈圣经》感情的定义;感情是依赖,是瘾魂驱动欲望过程中的殷勤创作。 《博弈圣经》爱的定义;我们把文化进程中被瘾魂驱动的欲望抛弃了自我之后,自由给予的真、善、美,定义为爱。《博弈圣经》规律的定义;规律,就是前因后果,是前一个状态和后一个状态之间可复制的恒定关系。《博弈圣经》草根的定义;草根二字,在中共媒体上经常出现,它是中国特色社会主义理论,也是东方暴徒对中国同胞的侮辱性言论。(中共土改,杀了资本家、杀了地、富、反、坏、右,中国已无贵族。也许自己刚刚从草根脱贫,自以为是贵族。西方贵族文化中有一个数字,3代以上……称为贵族)《博弈圣经》智慧的定义;智慧就是文化进程中独创的执行力。《博弈圣经》领导的定义;我们把指向‘私湍"或指向“实体”权威的信息,看成领导。《博弈圣经》政党的定义;在一个司法独立的国家实体里,法定允许团伙冠名、发展、壮大成的帮派,称其为政党。《博弈圣经》经典理论的定义;我们把历史选择的原创性、持久性、震撼性的理论,称之为经典理论。《博弈圣经》战略的定义:战略是,寻找、连续、正理、科学的,文明实体。《博弈圣经》战术的定义:战术是,达成、局部、真理、文明的,文化性质。《博弈圣经》赢的定义;赢,不是大小、不是多少、不是均衡平衡、不是战略战术,而是在未来国正论的随机状态中,一粒期望的粒子(常数0.007813,也是私湍边际效应)优先达成。《博弈圣经》纳什均衡的定义;纳什均衡,是黑暗中的教唆、无知中的误判、猎奇中的杂耍。《博弈圣经》道德的定义;优先预测悲剧后、作出的忍让,是道德。《博弈圣经》博弈的定义;优先预测胜利前、作出的竞争,是博弈。《博弈圣经》博弈论的定义;我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成三维均衡的语文学理论,称为博弈论。《博弈圣经》决策的定义:意识,在没有引入空间之前,可以改变自己的状态,一旦被空间包围,就是决策。《博弈圣经》进步的定义;就是你在传承的方向上播撒的欲望,反应在他者的思维中。《博弈圣经》交流的定义;就是共同驱逐自我身中和它者身中之后建立的关系。《博弈圣经》真理的定义;真理是一个观念、在个别情况下、判断中,现时的体验。《博弈圣经》知识的定义;我把识别万物实体与性质的是与不是,定义为知识。《博弈圣经》经验的定义;我们用矛盾论的辩证法进行的逻辑推理,区分出两个同性质——是到是的过程,称其为经验。《博弈圣经》博弈知识论的定义;人们用国正论对实体与性质的区分,统称为博弈知识论。《博弈圣经》博弈的基本原则定义;以人为本对应的唯物主义是一项博弈的基本原则。《博弈圣经》互联网的定义;互联网是博弈实体,是地球上最美的三人之舞,他们是大众、实体、上帝,在博弈的第三空间里一起互动。《博弈圣经》主义的定义;博弈圣经著作人悄悄的披露,主义就是个人主张。《博弈圣经》革命斗争的定义;马克思主张的革命斗争,比动物目光的相互对视、表达的敌意,更加凶残。《博弈圣经》矛盾论哲学的定义;后辈发现“人”是一粒病毒,一粒容易变异成矛盾论的二维病毒,专门寄生在实体、私湍、粒子体上,才能实现矛盾论哲学的扩充,当宿主遇到危机或困难时,矛盾论哲学将每一个人变成一个个复仇的怪物。《博弈圣经》马克思主义的定义;人们把马克思的个人主张看成主题,在博弈的第三空地里,用欲望的集体狂欢,实验主体、主张、主题的意义,这就是马克思主义。《博弈圣经》共产主义的定义;共产主义是马克思,在穷困、绝望时的幻像,为了摆脱清贫,任何一个人都会构造出来一套,掠夺、瓜分、共产的文化主张。《博弈圣经》意识形态的定义;意识形态,像是一段无声流动的电影画面。《博弈圣经》观念的定义;观念近似一张中心思想的相片、独立的存在文化进程中。《博弈圣经》中心思想的定义;我们把感觉、思维、意识、观念,定义为中心思想。……。经济学世界十部经典著作1、亚当斯密(英国)《国富论》。斯密此书是现代经济学的奠基之作,也是最伟大的经济学著作。他的劳动价值论,分工与专业化是经济效率之源的理论,“看不见的手”实体经济特性与性质自由主义理论,对后人博弈实体经济学的启发,对经济学的贡献堪比牛顿对物理学的贡献。2、曹国正(新加坡)《博弈圣经》。独创了国正论、国正双赢理论和粒子行为论,是新加坡政府认定的一部,影响人类非物质文化的经济学高级学术著作,他的粒子基因的映射均衡和单方占优的博弈取胜理论,引起世界政治、经济、军事、外交、科学,自然哲学和博弈论界的极大关注。3、大卫李嘉图(英国)《政治经济学与赋税原理》(第一卷)。李嘉图是伦敦交易所里成功的投机商人,又能在经济学理论领域做出不朽贡献。本书中他阐明的比较优势理论是现代自由贸易政策的理论基础。4、马克思(德国)《资本论》。马克思的剩余价值理论,人人耳熟能详,就其概述的经济学现象对改变世界的力量之大,入选了最重要的经济学著作。5、瓦尔拉斯(法国)《纯粹经济学要义》。现代经济学的主观价值(效用)论、边际革命、经济学数理化的转向通过本书而系统化,熊彼特曾赞誉此书为,经济学所取得的最高成就。6、费雪(美国)《利息理论》。此书是迄今为止最伟大的关于资本理论的研究,在马克思发现剩余价值的地方,他看见的是放弃当前消费而承担未来的不确定性风险,所获得的报酬。7、凯恩斯(英国)《就业、利息和货币通论》。被称为宏观经济学的奠基者,他最重要的理论认为,理性通过个人性质与性质的自由竞争会自然产生社会理性,就这一理论遭到了质疑和批判,其争议的主要原因,是来自社会的理性遇到国家政治干预时缺失了博弈实体政治的理论。8、马歇尔(英国)《经济学原理》。马歇尔的最主要著作是1890年出版的《经济学原理》一书,被西方经济学界公认为划时代的著作,也是继《国富论》之后最伟大的经济学著作。该书所阐述的经济学说,在西方经济学中一直占据着支配地位。9、萨缪尔逊(美国)《经济学》。把一本教科书选为最重要的经济学著作,也是发行量最大的经济学教科书,他在经济学知识的标准化、体系化方面做出的贡献,比当代任何一个人都多,就其入选最重要的经济学著作。10、布坎南(美国)《同意的计算》。本书开创的“公共选择”理论,使宪政民主制可以用数理工具定量分析和定量运算,人们用他的理论研究政治与经济制度的形成,开辟了全新的路径。来源:美闻网-美国资讯网-美国麻省理工学院

纳什均衡是什么意思?

通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。在纳什均衡中,每一个理性的参与者都不会有单独改变策略的冲动。处类似“囚徒困境”这样的博弈中,背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡结果,就是双方参与者都背叛对方。试想一个简单的博弈,张三和李四这两个员工都想要加薪。假如只有一个员工要求加薪,老板会答应:但要是两个人都要求加薪,老板就会生气,并把两个人统统开除。这场博弈有两个纳什均衡,一个是只有张三要求加薪,另一个是只有李四要求加薪。两个员工都不要求加薪并不是纳什均衡,因为当两个人知道对方没有提出要求时,就会后悔自己的选择。两个人都要求加薪也不是纳什均衡,因为两个人事后都会后悔自己被开除。稳定而自私的结果,就是一个纳什均衡。

什么是“纳什均衡”?

纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。”也就是说,所有人的战略都是最优的。而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。a,b面临抉择。显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。

纳什均衡理论具体讲些什么?

看一下《美丽心灵》就知道了。。。

什么是纳什均衡?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡

博弈论的纳什均衡

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*) ≤ 偶对(a*,b*) ≥偶对(a*,b)。对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。   纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 囚徒困境在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner"s dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈 [Prisoner"s dilemma]A╲B 坦白 抵赖 坦白 8,8 0,10 抵赖 10,0 1,1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的策发生改变。比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破“行规”。我们正处于大数据时代,向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。 智猪博弈 一、经济学中的“智猪博弈”(Pigs"payoffs) 这个例子讲的是:假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽(两猪均在食槽端),另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是在去往食槽的路上会有两个单位猪食的体能消耗,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。智猪博弈由纳什于1950年提出。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:   小猪    行动 等待 大猪 行动 5,1 4,4  等待 9,-1 0,0 从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。在智猪博弈中,虽然小猪的“捡现成”的行为从道义上来讲令人不齿,但是博弈策略的主要目的不正是使用谋略最大化自己的利益吗? 美女的硬币 一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学考虑就是另外一回事了,这个游戏真的够公平吗? 绅士/美女 女正面 女反面 正面 3,-3 -2,+2 反面 -2,+2 1,-1 假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)这个方程通俗的说就是在对手一直出正面你得到的利益,和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入,计算结果是-1/8元。同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y)解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。看起来这个博弈模型似乎没有什么用处,但是其实这可能牵涉了金融市场定价中最重要的一个模型:定价权重模型了。总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来,并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,更方便我们对规则进行制定和调整,使其最终按照我们所预期的目的进行运作。

纳什均衡是什么意思?

纳什均衡理论又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略。则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料纳什均衡理论创始人约翰·纳什介绍——1928年6月13日—2015年5月23日,提出纳什均衡的概念和均衡存在定理,是著名经济学家、《美丽心灵》男主角原型,前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。参考资料来源:百度百科——纳什均衡

什么是纳什均衡?

纳什均衡理论又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略。则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料纳什均衡理论创始人约翰·纳什介绍——1928年6月13日—2015年5月23日,提出纳什均衡的概念和均衡存在定理,是著名经济学家、《美丽心灵》男主角原型,前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。参考资料来源:百度百科——纳什均衡

什么是纳什均衡理论?

一农户在杀鸡前的晚上喂鸡,不经意地说:快吃吧,这是你最后一顿!第二日,见鸡已躺倒并留遗书:爷已吃老鼠药,你们别想吃爷了,爷也不是好惹的。当对手知道了你的决定之后,就能做出对自己最有利的决定。——纳什均衡理论

什么是纳什均衡?

纳什均衡是指纳什平衡,纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。扩展资料:纳什均衡的影响1、改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域。2、扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。3、形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。4、扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什平衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。参考资料来源:百度百科-纳什平衡

纳什均衡是什么意思?

纳什均衡是指纳什平衡,纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。扩展资料:纳什均衡的影响1、改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域。2、扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。3、形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。4、扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什平衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。参考资料来源:百度百科-纳什平衡

什么是纳什均衡?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡

纳什均衡是什么?

纳什均衡是指纳什平衡,纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。扩展资料:纳什均衡的影响1、改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域。2、扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。3、形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。4、扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什平衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。参考资料来源:百度百科-纳什平衡

纳什均衡是什么?

纳什均衡是指纳什平衡,纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。扩展资料:纳什均衡的影响1、改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域。2、扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。3、形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。4、扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什平衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。参考资料来源:百度百科-纳什平衡

简要论述占优策略均衡和纳什均衡之间的区别。

【答案】:占优策略均衡是指这样一种状态,不管对方选择什么样的策略,本方所选择的策略都是最好的;不管本方选择什么样的策略,对方所选择的策略都是最好的。而纳什均衡则不同,它是指给定对方的策略,本方所选择的是最好的;给定本方的策略,对方所选择的是最好的。很显然,纳什均衡的定义要比占优策略均衡大,占优策略均衡一定会是纳什均衡,但纳什均衡不一定是占优策略均衡。

为什么混合策略纳什均衡一定存在?

混合策略纳什均衡:在n个参与人的博弈G={S1 ,... Sn ; u1 ,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:所以只要有人的参与,混合策略纳什均衡就一定存在。也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

双头垄断是否是一个纳什均衡?

当然,吉尔也会以同样的方法推理。如果这样的话,杰克和吉尔将各带40加仑水来到镇上。总销售量将是80加仑,而价格将下降为40美元。因此,如果双头在个别地决定生产多少时追求自己的私利,他们生产的总量大于垄断的产量,收取的价格低于垄断价格,而且,赚到的总利润小于垄断利润。虽然利己的逻辑使双头产量的增加大于垄断水平,但不会使双头达到竞争的配置。考虑当每个双头生产40加仑时会出现的情况。价格是40美元,而且每个双头得到1600美元利润。在这种情况下,杰克利己的逻辑又得出了不同的结论:“现在我的利润是1600美元。假设我把我的生产增加到50加仑。在这种情况下,总计可以销售90加仑水,价格是30美元一加仑。这时我的利润只是1500美元。增加生产会使价格下降,我把生产保持在40加仑上,我的状况会变得好一些。”杰克和吉尔各生产40加仑的结果看来像某种均衡。实际上,这种结果被称为纳什均衡(以纪念经济理论家约翰?纳什而命名)。纳什均衡是相互作用的经济主体,每个人都在另一方所选择的战略为既定时,选择自己的最优战略。在这个例子中,在吉尔生产40加仑为既定时,杰克的最优战略是生产40加仑。同样,在杰克生产40加仑为既定时,吉尔的最优战略是生产40加仑。一旦他们达到了这种纳什均衡,杰克和吉尔都没有作出不同决策的激励。

纳什均衡的经典案例

(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。 囚徒困境博弈A╲B 坦白 抵赖 坦白 -8,-8 0,-10 抵赖 -10,0 -1,-1 关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。 你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。 你美女 美女出正面 美女出反面 你出正面 +3,-3 -2,+2 你出反面 -2,+2 +1,-1 假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等(不然对方可以改变正反面出现的概率让我们的总收入减少),由此列出方程就是3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )解方程得x=3/8。同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。

纳什均衡

第1节 纳什:天才还是疯子?《美丽心灵》是一部非常经典的影片,它再现了伟大的数学天才约翰·纳什的传奇经历,影片本身以及背后的人物原型都深深地打动了人们。这部影片上演后接连获得了第59届金球奖的5项大奖,以及2002年第74届奥斯卡奖的4项大奖。纳什是一位数学天才,他提出的“纳什均衡”是博弈论的理论支柱。同时,他还是诺贝尔经济学奖获得者。但这并不是他的全部,只是他传奇人生中辉煌的一面。我们在讲述“纳什均衡”之前,先来了解这位天才的传奇人生。纳什于1928年出生在美国西弗吉尼亚州。他的家庭条件非常优越,父亲是工程师,母亲是教师。纳什小时候性格孤僻,不愿意和同龄孩子一起玩耍,喜欢一个人在书中寻找快乐。当时纳什的数学成绩并不好,但还是展现出了一些天赋。比如,老师用一黑板公式才能证明的定理,纳什只需要几步便可完成,这也时常会让老师感到尴尬。 1948年,纳什同时被4所大学录取,其中便包括普林斯顿、哈佛这样的名校,最终纳什选择了普林斯顿。当时的普林斯顿学术风气非常自由,云集了爱因斯坦、冯·诺依曼等一批世界级的大师,并且在数学研究领域一直独占鳌头,是世界的数学中心。纳什在普林斯顿如鱼得水,进步非常大。 1950年,纳什发表博士论文《非合作博弈》,他在对这个问题继续研究之后,同年又发表了一篇论文《n人博弈中的均衡点》。这两篇论文不过是几十页纸,中间还掺杂着一些纳什画的图表。但就是这几十页纸,改变了博弈论的发展,甚至可以说改变了我们的生活。他将博弈论的研究范围从合作博弈扩展到非合作博弈,应用领域也从经济领域拓展到几乎各个领域。可以说“纳什均衡”之后的博弈论变成了一种在各行业各领域通用的工具。 发表博士论文的当年,纳什获得数学博士学位。1957年他同自己的女学生阿丽莎结婚,第二年获得了麻省理工学院的终身学位。此时的纳什意气风发,不到30岁便成为了闻名遐迩的数学家。1958年,《财富》杂志做了一个评选,纳什被评选为当时数学家中最杰出的明星。上帝喜欢与天才开玩笑,处于事业巅峰时期的纳什遭遇到了命运的无情打击,他得了一种叫作“妄想型精神分裂症”的疾病。这种精神分裂症伴随了他的一生,他常常看到一些虚幻的人物,并且开始衣着怪异,上课时会说一些毫无意义的话,常常在黑板上乱写乱画一些谁都不懂的内容。这使得他无法正常授课,只得辞去了麻省理工大学教授的职位。 辞职后的纳什病情更加严重,他开始给政治人物写一些奇怪的信,并总是幻觉自己身边有许多苏联间谍,而他被安排发掘出这些间谍的情报。精神和思维的分裂已经让这个曾经的天才变成了一个疯子。 他的妻子阿丽莎曾经深深被他的才华折服,但是现在面对着精神日益暴躁和分裂的丈夫,为了保护孩子不受伤害,她不得不选择同他离婚。不过,他们的感情并没有就此结束,她一直在帮他恢复。1970年,纳什的母亲去世,他的姐姐也无力抚养他,当纳什面临着露宿街头的困境时阿丽莎接收了他,他们又住到了一起。阿丽莎不但在生活中细致入微地照顾纳什,还特意把家迁到僻静的普林斯顿,远离大城市的喧嚣,她希望曾经见证纳什辉煌的普林斯顿大学能重新唤起纳什的才情。 妻子坚定的信念和不曾动摇过的爱深深地感动了纳什,他下定决心与病魔做斗争。最终在妻子的照顾和朋友的关怀下,20世纪80年代纳什的病情奇迹般地好转,并最终康复。至此,他不但可以与人沟通,还可以继续从事自己喜欢的数学研究。在这场与病魔的斗争中,他的妻子阿丽莎起了关键作用。走出阴影后的纳什成为1985年诺贝尔经济学奖的候选人,依据是他在博弈论方面的研究对经济的影响。但是最终他并没有获奖,原因有几个方面,一方面当时博弈论的影响和贡献还没有被人们充分认识;另一方面瑞典皇家学院对刚刚病愈的纳什还不放心,毕竟他患精神分裂症已经将近30年了,诺贝尔奖获得者通常要在颁奖典礼上进行一次演说,人们担心纳什的心智没有完全康复。 等到了1994年,博弈论在各领域取得的成就有目共睹,机会又一次靠近了纳什。但是此时的纳什没有头衔,瑞典皇家学院无法将他提名。这时纳什的老同学、普林斯顿大学的数理经济学家库恩出马,他先是向诺贝尔奖评选委员会表明:纳什获得诺贝尔奖是当之无愧的,如果以身体健康为理由将他排除在诺贝尔奖之外的话,那将是非常糟糕的一个决定。同时库恩从普林斯顿大学数学系为纳什争取了一个“访问研究合作者”的身份。这些努力没有白废,最终纳什站在了诺贝尔经济学奖高高的领奖台上。 当年,同时获得诺贝尔经济学奖的还有美国经济学家约翰·海萨尼和德国波恩大学的莱茵哈德·泽尔腾教授。他们都是在博弈论领域做出过突出贡献的学者,这标志着博弈论得到了广泛的认可,已经成为经济学的一个重要组成部分。 经过几十年的发展,“纳什均衡”已经成为博弈论的核心,纳什甚至已经成了博弈论的代名词。看到今天博弈论蓬勃地发展,真的不敢想象没有约翰·纳什的博弈论世界会是什么样子。 第2节 解放博弈论我们一直在说纳什在博弈论发展中所占的重要地位,但是感性的描述是没有力量的,下面我们将从博弈论的研究和应用范围具体谈一下纳什的贡献,看一下“纳什均衡”到底在博弈论中占有什么地位。 前面我们已经介绍过了,博弈论是由美籍匈牙利数学家冯·诺依曼创立的。创立之初博弈论的研究和应用范围非常狭窄,仅仅是一个理论。1944年,随着《博弈论与经济行为》的发表,博弈论开始被应用到经济学领域,现代博弈论的系统理论开始逐步形成。 直到1950年纳什创立“纳什均衡”以前,博弈论的研究范围仅限于二人零和博弈。我们前面介绍过博弈论的分类,按照博弈参与人数的多少,可以分为两人博弈和多人博弈;按照博弈的结果可以分为正和博弈、零和博弈和负和博弈;按照博弈双方或者多方之间是否存在一个对各方都有约束力的协议,可以分为合作博弈和非合作博弈。 纳什之前博弈论的研究范围仅限于二人零和博弈,也就是参与者只有两方,并且两人之间有胜有负,总获利为零的那种博弈。 两人零和博弈是游戏和赌博中最常见的模式,博弈论最早便是研究赌博和游戏的理论。生活中的二人零和博弈没有游戏和体育比赛那么简单,虽然是一输一赢,但是这个输赢的范围还是可以计算和控制的。冯·诺依曼通过线性运算计算出每一方可以获取利益的最大值和最小值,也就是博弈中损失和赢利的范围。计算出的利益最大值便是博弈中我们最希望看到的结果,而最小值便是我们最不愿意看到的结果。这比较符合一些人做事的思想,那就是“抱最好的希望,做最坏的打算”。 二人零和博弈的研究虽然在当时非常先进和前卫,但是作为一个理论来说,它的覆盖面太小。这种博弈模式的局限性显而易见,它只能研究有两人参与的博弈,而现实中的博弈常常是多方参与,并且现实情况错综复杂,博弈的结局不止有一方获利另一方损失这一种,也会出现双方都赢利,或者双方都没有占到便宜的情况。这些情况都不在冯诺依曼当时的研究范围内。 这一切随着“纳什均衡”的提出全被打破了。1950年,纳什写出了论文《n人博弈中的均衡点》,其中便提到了“纳什均衡”的概念以及解法。当时纳什带着自己的观点去见博弈论的创始人冯·诺依曼,遭到了冷遇,之前他还遭受过爱因斯坦的冷遇。但是这并不能影响“纳什均衡”带给人们的轰动。 从纳什的论文题目《n人博弈中的均衡点》中可以看出,纳什主要研究的是多人参与,非零和的博弈问题。这些问题在他之前没人进行研究,或者说没人能找到对于各方来说都合适的均衡点。就像找出两条线的交汇点很容易,如果有的话,但是找出几条线的共同交汇点则非常困难。找到多方之间的均衡点是这个问题的关键,找不到这个均衡点,这个问题的研究便会变得没有意义,更谈不上对实践活动有什么指导作用。而纳什的伟大之处便是提出了解决这个难题的办法,这把钥匙便是“纳什均衡”,它将博弈论的研究范围从“小胡同”里引到了广阔天地中,为占博弈情况大多数的多人非零和博弈找到意义。纳什的论文《n人博弈中的均衡点》就像惊雷一样震撼了人们,他将一种看似不可能的事情变成了现实,那就是证明了非合作多人博弈中也有均衡,并给出了这种均衡的解法。“纳什均衡”的提出,彻底改变了人们以往对竞争、市场,以及博弈论的看法,它让人们明白了市场竞争中的均衡同博弈均衡的关系。 “纳什均衡”的提出奠定了非合作博弈论发展的基础,此后博弈论的发展主要便是沿着这条线进行。此后很长一段时间内,博弈论领域的主要成就都是对“纳什均衡”的解读或者延伸。甚至有人开玩笑说,如果每个人引用“纳什均衡”一次需要付给纳什一美元的话,他早就成为最富有的人了。 不仅是在非合作博弈领域,在合作博弈领域纳什也有突出的贡献。合作型博弈是冯·诺依曼在《博弈论与经济模型》一书中建立起来的,非合作型博弈的关键是如何争取最大利益,而合作型博弈的关键是如何分配利益,其中分配利益过程中的相互协商是非常重要的,也就是双方之间你来我往的“讨价还价”。但是冯·诺依曼并没有给出这种“讨价还价”的解法,或者说没有找到这个问题的解法。纳什对这个问题进行了研究,并提出了“讨价还价”问题的解法,他还进一步扩大范围,将合作型博弈看做是某种意义上的非合作性博弈,因为利益分配中的讨价还价问题归根结底还是为自己争取最大利益。 除此之外,纳什还研究博弈论的行为实验,他就曾经提出,简单的“囚徒困境”是一个单步策略,若是让参与者反复进行实验,就会变成一个多步策略。单步策略中,囚徒双方不会串供,但是在多步策略模式中,就有可能发生串供。这种预见性后来得到了验证,重复博弈模型在政治和经济上都发挥了重要作用。 纳什在博弈论上做出的贡献对现实的影响得到越来越多的体现。20世纪90年代,美国政府和新西兰政府几乎在同一时间各自举行了一场拍卖会。美国政府请经济学家和博弈论专家对这场拍卖会进行了分析和设计,参照因素就是让政府获得更多的利益,同时让商家获得最大的利用率和效益,在政府和商家之间找到一个平衡点。最终的结局是皆大欢喜,拍卖会十分成功,政府获得巨额收益,同时各商家也各取所需。而新西兰举行的那场拍卖会却是非常惨淡,关键原因是在机制设计上出现了问题,最终大家都去追捧热门商品,导致最后拍出的价格远远高于其本身的价值;而一些商品则无人问津,甚至有几种商品只有一个人参与竞拍,以非常低的成交价就拍走了。 正是因为对现实影响的日益体现,所以1994年的诺贝尔经济学奖被授予了包括纳什在内的三位博弈论专家。 我们最后总结一下纳什在博弈论中的地位,中国有句话叫“天不生仲尼,万古长如夜”。意思是老天不把孔子派到人间,人们就像永远生活在黑夜里一样。我们如果这样说纳什同博弈论的关系的话,就会显得夸张。但是纳什对博弈论的开拓性发展是任何人都无可比拟的,在他之前的博弈论就像是一条逼仄的胡同,而纳什则推倒了胡同两边的墙,把人们的视野拓展到无边的天际。

如何分析多个纳什均衡同时出现?

一次博弈最终总会形成一个结果,好比讨价还价,这就是博弈均衡。"纳什均衡"是一种最常见的、也是最重要的博弈均衡。它是美国天才数学家纳什在1950年正在攻读博士学位时提出来的,论文题为《n人博弈的均衡问题》。纳什巧妙运用数学技巧,证明了如下定理:对一任何一个n人参与的非合作博弈(零和或非零和),如果每个参与者的策略是有限的,那么一定存在至少一个纳什均衡解集。该论文只有短短一页纸,但却成了博弈论的经典文献,并使他获得了诺贝尔经济学奖。"纳什均衡"的经典案例是"囚徒困境":两个作案嫌疑人分别关在两件牢房,警察告知,如果两人都招供,则各坐牢3年;如果两人都不招供,则放出;如果一人招供而另一人不招供,则招供的坐牢3年,不招供的坐牢10年。局外人看来,最好两人都不招供。但从每个人来看,招与不招的代价分别为{3;3}与{0;10},还是招供为好。但从纳什均衡却得出一个悖论:单个人的最优选择却没有导致全局最佳的结果。现实中的例子很多,如价格战的结果是两败俱伤。"纳什均衡"证明了一个道理:非合作博弈的情况下困境无法解脱。参考资料:龙博E站

“纳什均衡危机”是什么意思?

动态博弈战略行动在动态博弈中,参与人为了使得其他参与人的选择对自己有利,往往采取一些行动来影响其他参与人对于自己行为的预期。这些行为称为战略行动(strategic move)。1.首先行动优势首先行动优势(first-mover advantage)是指,在博弈中首先作出战略选择并采取相应行动的参与人可以获得较多的利益。2.确实可信的威胁确实可信的威胁(credible threat)是指,博弈的参与人通过某种行动改变自己的支付函数,从而使得自己的威胁显得可信。参与人为改变博弈结果而采取的措施称为承诺(commitment)。第四节 不完全信息静态博弈在许多情况下,参与人对对手的了解往往是不够精确的。这种情况下的博弈就是不完全信息博弈。举例来说,某一市场原来被A企业所垄断。现在B企业考虑是否进入。B企业知道,A企业是否允许它进入,取决于A企业阻挠B企业进入所花费的成本。如果阻挠的成本低,那么,正如表7-10后两列所表示的,A企业的占优战略是阻挠,博弈有重复剔除的占优战略均衡――A阻挠,B不进入。如果阻挠的成本高,那么,正如表7-10前两列所表示的,A企业的占优战略是默许B进入,博弈有重复剔除的占优战略均衡――A默许,B进入。B企业所不知道的,是A企业的阻挠成本是高是低。这里,某一参与人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全部私人信息称为他的类型。在上述例子中,阻挠成本就是 A的私人信息。高阻挠成本和低阻挠成本则是两种不同的类型。显然,在这里,B所遇到的,是不确定性条件下的选择问题。因为B不仅不知道A的类型(是高还是低),而且不知道不同类型的分布概率。解决这类问题的方法之一,就是把不确定性条件下的选择转换为风险条件下的选择。在风险条件下,B虽然不知道A的类型,但可以知道不同类型的分布概率。将不确定性条件下的选择转换为风险条件下的选择,称为海萨尼转换(the Harsanyi transformation)。按照海萨尼的方法,所有参与人的真实类型都是给定的。其他参与人虽然不清楚某一参与人的真实类型,但知道这些可能出现的类型的分布概率,而且这种概率是公共知识。用上例来说,公共知识不仅意味着B企业知道A企业高阻挠成本与低阻挠成本的分布概率,而且意味着A也清楚B知道这一概率。通过海萨尼转换,不完全信息博弈变成了完全但不完美信息博弈(games of complete but imperfect information)。这里的不完美信息,就是指其他参与人只知道某一参与人某些方面类型的分布概率,而不知道该参与人在这些方面的真实类型。在上述转换的基础上,海萨尼提出了贝叶斯纳什均衡(Bayesian Nash equilibrium)。对此,可以作如下解释:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。因此,该参与人的决策目标就是:在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化。贝叶斯纳什均衡是一种类型依赖型战略组合。在给定自己的类型和其他参与人类型的分布概率的条件下,这种战略组合使得每个参与人的期望效用达到了最大化。回到上面提到的市场进入的例子。在这个例子里,对于挑战者B来说,原垄断者A在阻挠成本方面,存在着两种可能性:高成本或低成本。B不知道A的阻挠成本究竟是高是低,但他知道A在这两种不同阻挠成本下会作出的选择,以及不同阻挠成本(类型)的分布概率。假定高成本的概率为x,则低成本的概率为(1-x)。如果A的阻挠成本高,A将默许B进入市场;如果A的阻挠成本低,A将阻挠B进入市场。在这两种情况下,如表7-10所示,B进入的支付函数分别是得到40和失去10。因此,B选择进入所得到的期望利润为40x+(-10)(1- x),选择不进入的期望利润为0。简单的计算表明,当A阻挠成本高的概率大于20%时,挑战者B选择进入得到的期望利润大于选择不进入的期望利润。此时,选择进入是B的最优选择。此时的贝叶斯纳什均衡为,挑战者B选择进入,高成本原垄断者选择默许,低成本原垄断者选择阻挠。根据参与者类型的公共知识获得参与者行动的概率,依此决定下一步策略。第五节 不完全信息动态博弈在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。如上所述,在不完全信息条件下,博弈的参与人知道其他参与人可能有哪几种类型,也知道不同的类型与相应战略选择之间的关系。但他们并不知道其他参与人的真实类型。在不完全信息静态博弈中,我们是通过海萨尼转换,即通过假定其他参与人知道某一参与人的所属类型的分布概率,来得出博弈的贝叶斯纳什均衡结果的。而在不完全信息动态博弈中,问题变得更加简单。博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。他只是对这一概率分布有自己的主观判断,即有自己的信念。博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。并根据这种不断变化的信念,作出自己的战略选择。对应于不完全信息动态博弈的均衡概念是精炼贝叶斯均衡(perfect Bayesian equilibrium)。这个概念是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯(纳什)均衡的结合。具体来说,精炼贝叶斯均衡是所有参与人战略和信念的一种结合。它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的。第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的。贝叶斯法则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。采用上一节的例子,可以将贝叶斯规则的分析思路表达如下。挑战者B不知道原垄断者A是属于高阻挠成本类型还是低阻挠成本类型,但B知道,如果A属于高阻挠成本类型,B进入市场时A进行阻挠的概率是20%(此时A为了保持垄断带来的高利润,不计成本地拼命阻挠);如果A属于低阻挠成本类型,B进入市场时A进行阻挠的概率是100%。博弈开始时,B认为A属于高阻挠成本企业的概率为70%,因此,B估计自己在进入市场时,受到A阻挠的概率为:0.7×0.2+0.3×1=0.440.44是在B给定A所属类型的先验概率下,A可能采取阻挠行为的概率。当B进入市场时,A确实进行阻挠。使用贝叶斯法则,根据阻挠这一可以观察到的行为,B认为A属于高阻挠成本企业的概率变成A属于高成本企业的概率=0.7(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.44=0.32根据这一新的概率,B估计自己在进入市场时,受到A阻挠的概率为:0.32×0.2+0.68×1=0.744如果B再一次进入市场时,A又进行了阻挠。使用贝叶斯法则,根据再次阻挠这一可观察到的行为,B认为A属于高阻挠成本企业的概率变成A属于高成本企业的概率=0.32(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.744=0.086这样,根据A一次又一次的阻挠行为,B对A所属类型的判断逐步发生变化,越来越倾向于将A判断为低阻挠成本企业了。以上例子表明,在不完全信息动态博弈中,参与人所采取的行为具有传递信息的作用。尽管A企业有可能是高成本企业,但A企业连续进行的市场进入阻挠,给B企业以A企业是低阻挠成本企业的印象,从而使得B企业停止了进入地市场的行动。应该指出的是,传递信息的行为是需要成本的。假如这种行为没有成本,谁都可以效仿,那么,这种行为就达不到传递信息的目的。只有在行为需要相当大的成本,因而别人不敢轻易效仿时,这种行为才能起到传递信息的作用。传递信息所支付的成本是由信息的不完全性造成的。但不能因此就说不完全信息就一定是坏事。研究表明,在重复次数有限的囚徒困境博弈中,不完全信息可以导致博弈双方的合作。理由是:当信息不完全时,参与人为了获得合作带来的长期利益,不愿过早暴露自己的本性。这就是说,在一种长期的关系中,一个人干好事还是干坏事,常常不取决于他的本性是好是坏,而在很大程度上取决于其他人在多大程度上认为他是好人。如果其他人不知道自己的真实面目,一个坏人也会为了掩盖自己而在相当长的时期内做好事。

纳什均衡是不是帕累托均衡?

长文“帕累托最优处处满足吗?”中的一部分:帕累托最优与纳什均衡是不同的。譬如,“囚徒困境”是博弈论(或称对策论、赛局理论)中经常使用的一个理论分析模型。该模型说的是,甲和乙合伙抢了银行,被抓获。他们被关进分隔的牢房。检察官分别告诉他们:如果两人都不坦白,他们会因非法携带枪支的罪名各判刑1年;如果其中一人招供而另一人不招供,坦白者作为证人将不会被起诉,另一人将会被重判10年徒刑;如果两人都招供,则两人都会以抢劫罪名各判5年徒刑。结果,两个人都招供了。在博弈论中,这种结果是一种纳什均衡,即给定别人策略的情况下,没有任何单个局中人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡。在上述囚徒困境模型中,如果甲相信乙招供,那么他的最佳策略是招供,而如果乙相信甲招供,那么他的最佳策略仍是招供。这就是一个纳什均衡,它是“自确定”的。但是,这个纳什均衡不是帕累托最优。在经济学上,帕累托最优指的是:在给定现有资源条件下,不存在任何其他配置结果使某些人情况更好,而又不使任何其他人处境更坏。显然,在上述囚徒困境模型当中,甲乙两个人都从理性的角度出发,追求自身效用的最大,结果是双方不合作,都认罪了。也就是说,实现了纳什均衡。但是,如果甲与乙合作,产生的结果要比双方不合作好得多。也就是说,如果双方合作,就存在帕累托改进(帕累托改进是指一种变化,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。帕累托改进是达到帕累托最优的路径和方法)。那么,为什么两人不敢合作呢?甲会这样推理:“假如乙不招供,我只要一招供,立即可以获得自由,而不招供却要坐牢1年,显然招供比不招供好;假如乙招供了,我若不招供,则要坐牢10年,招供了只坐5年牢,显然还是招供的好。可见,无论乙招供与不招供,我的最佳选择都是招供。”同理,乙也会如此推理。于是,谁也不敢选择合作。所以,在囚徒困境这个模型当中,从个人的理性出发,推导不出帕累托最优。由此可见,纳什均衡只是一种平衡,而不是一种帕累托最优,不是一种完美的结局。

怎么求纯策略纳什均衡和混合纳什策略

不从策略纳什均衡和混合,那时政策没有听说过这两个术语,不知道自己怎么处理。

博弈论 纳什均衡

囚徒困境 智猪博弈 纳什均衡

什么是纳什均衡?纳什均衡一定是最优的吗

【答案】:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡不一定是最优的,例如囚徒困境。

占优策略均衡和纳什均衡怎么区分?

主要从两者定义来区分:(1)占优策略均衡是指博弈中的所有参与者的占优策略组合所构成的均衡就是占优策略均衡。(2)纳什平衡又称非合作博弈均衡,是博弈论的一个重要术语。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,则这个组合就定义为纳什平衡。(3)无论其他博弈者采用何种策略,若某一个博弈者的策略总是最好的,则该策略就是占优策略。在两个(或全部)博弈者都采用占优策略时这种结果是一种占优均衡。在其他博弈者的策略给定时,没有一方还能改善获利的情况则称为纳什均衡。扩展资料纳什平衡的由来:关于纳什平衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什平衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什平衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论.进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。”参考资料来源百度百科-纳什平衡百度百科-占优策略均衡

子博弈精炼纳什均衡的定义

子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。博弈论专家常常使用“序贯理性”(Sequential rationality):指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。子博弈精炼纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完全信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。求解方法: 最后一个结点上的子博弈(纳什均衡)→倒数第二个(纳什均衡) → ······ → 初始结点上的子博弈(纳什均衡)。

一分钟看懂博弈论——纳什均衡

最后我能给你解释道德绑架为什么让你反感,别觉得是学术你就不看了。 囚徒困境 两个囚徒被抓了,警察为了让他们坦白交代,分别提审两个人,这里分三种情况 1、两个人都不交代,没有证据,直接无罪释放 2、其中一个人交代了,一个人没交代,交代了的因为戴罪立功,判1年,没交代的判9年 3、两个人都交代,每个人判6年 两个人没有串供的机会,所以只能自行判断,假设每个人交代和不交代都占50%,则 第一个人没说的时候判刑的危险(后果*概率)50%*0+50%*9=4.5 第一个人交代了的时候判刑的危险(后果*概率)50%*1+50%*6=3.5 所以第一个人的最优策略是:交代,同理可证第二个人的最优策略一样是交代 所以两个人都交代是最符合从个人出发的最佳策略 但是如果从整体出发,两个人都交代是四个选择里面最差的,因为两个人一共要判12年,哪怕是一个人交代一个人没交代,都只需要两个人一共判10年 这就是纳什均衡:每个人都从个人最佳选择的角度出发,最终集体的利益受损。 有人说看不懂这个推导,那么你直接记住这句话即可:聪明人在一块,因为自私,选出一个傻子方案。 以上是为了解释清楚举了一个极端的例子,实际上根据条件不一样,每个人都从个人最佳选择的角度出发,最终不一定导致集体的选择最差,但是一定不是最好。 对于纳什均衡的应用: 1、你的对手和队友中一定有蠢货(也可能是受情绪影响而做出愚蠢的选择),这导致任何精确的算计都不精确 2、但是采取任何博弈的时候,都应该假定对手是聪明人和老司机。 3、一个社会和一个整体不美好,不是因为某一些人坏或者某一些人傻,而是因为所有聪明人按照纳什均衡的博弈的结果。 4、博弈的根据是给对方一个可以相信的美好的未来。 5、保持友善,因为没有一个必胜的策略。 6、当你有中等能力的时候,不要做任何博弈,直接翻牌。(这一点有严谨的证明,公式太多,写了你也不爱看) 7、多次博弈的过程中,双方或者多方会突破纳什均衡,这一突破,往往会形成道德——欺诈游戏中那个傻女猪脚完成了凑齐红苹果的伟大壮举——突破纳什均衡是让双方共赢的结果 最后这一点多解释一下,如果双方都进去了以后,再出来,又一起作案,这次提前约定好,只要是被抓住,我们都不说,不就都无罪释放了吗?结果双方突破了纳什均衡——提前约束好的行为,就是道德(举的例子有点反,明白意思就好)。 所以为什么很多人现在感觉到了道德绑架:这跟我们提前说好的不一样啊,凭什么我的道德让我判9年你判1年啊。明白了这些,我们看社会很多现象瞬间就会有不一样的视角,希望对你有所帮助

求高人详细诉说一下纳什均衡

[编辑本段][综合评价]  </B>  优点:堪称目前太阳的领袖,有着极高的篮球智商和冷静的打球方式,完美的球场洞察力。视野广阔,传球直达敌人心脏,投篮极佳(需要时可以成为绝杀球员),可以在球场任何区域发动攻击。  缺点:因为身体条件的诸多限制,防守较差(作为核心不能轻易犯规),对抗能力不足。 [编辑本段][进攻端]  </B>他是一个在进攻端堪称完美的后卫。作为17000分俱乐部的一员,他具备了优秀得分手所应该具备的一切素质:无论是突破上篮,中投,三分球还是罚球。除了灌篮,他几乎可以用任何方式得分。更可怕的是,尽管他得分如探囊取物,他却根本不需用得分来统治比赛,只有在必要的时候,他才会露出锋利的牙齿,比如2006对小牛时的48分,比如今年2007对湖人的32分。更多的时候他是出现在组织端,他和中锋的挡拆几乎是所有球队的噩梦。没有人会预计到他下一步会干什么,是传球,还是自己进攻?关键时刻敢挺身而出,给出一击致命。 [编辑本段][防守端]  </B>纳什不是完人,老天在赋予他无与伦比的进攻才华的同时,也给予了他糟糕的防守。纳什当年被几十所大学拒之门外,理由出奇地一致:"你的防守是我见过所有人中最差的。"由于身体素质太吃亏,纳什在防守高大控卫时几乎无计可施。在季后赛中,我们甚至屡屡可以看见他被湖人队的斯马什.帕克硬吃。尽管这个赛季他已经很努力地加强自己的防守意识,但是收效甚微。不过,太阳出色的轮换可以一定程度上弥补个人防守的不足。 [编辑本段][传球和助攻]  毫无疑问的大师级传球水准,他就是目前太阳队进攻的发起者.  -1非常擅长见缝插针似的传球,但是只要稍微有一点点可能,纳什都有把握把球传到其他队员手中.他几乎熟谙各种传球手段,包括难度很高的击地球。不需要太大的传球角度,他完全凭借着自己和队友之间的默契来完成助攻,值得一提的是纳什传球的节奏感非常好,接球者会非常的舒服,通常节奏对于一个投手来说是很重要的,而纳什的传球仿佛可以无形当中引领接球者的节奏。到位--接球--起跳--出手,整个动作可以一气呵成,流畅至极。所以说,球员身边有一位出色的控卫是一件相当幸福的事情---都能体会到球出手时那种流畅的快感。  -2提到传球就不能不提那另人惊艳的快攻,作为快攻的发起人,纳什出色的攻防转换意识联盟无出其右。当对手还沉浸在进攻得手的喜悦中时,当摄影机还在播放上一次进攻的精彩画面时,太阳的快攻组合已经完成反击退防了。华丽的长传令所有人目瞪口呆,准确地判断快下球员的跑动位置,然后是准确的传球到位。不需要任何的调整动作,接球者直接灌篮或上篮。更有甚者,可以看见小S和超级玛丽在快攻时先起跳,在空中等待纳什的传球,然后就是一个血脉喷张的灌篮。(现在马里昂已经走了)华丽到掉渣的配合.(P.S.他已经连续3个赛季荣膺助攻王称号~)。本赛季由于大鲨鱼奥尼尔的交易使得纳什失去了配合默契的马里昂,助攻数据微降,也使鲨鱼在场上时的战术(不要妄图让大仙人掌加入折返跑)有了调整。纳什正努力完成和鲨鱼的内外线配合,希望将这一全明星级的内外线变成真正的利器,威震江湖。 [编辑本段][球场外的素质]  </B>纳什是一个出色的领袖,尽管他缺少一些霸气,但他却在以自己的方式领导球队.当赛季初期发福的迪奥状态低靡时,他主动找到迪奥并提出警告,最终使法国人重回正轨.当他面对对手强大的气势时,球迷甚至可以感觉到他在努力使自己发怒了---励球队的士气。有领袖如斯,应该是所有太阳球迷的幸福。在更衣室里,他永远是那个最温和平静的人.在他身边你永远也感觉不到超级巨星的压迫感。他微笑着面对记者的提问,谨慎地斟酌自己的话语,从来没有厌倦和不耐烦。礼貌地对待身边的每一个人-论熟悉的或是陌生的。可以赢得对手敬意的男人. [编辑本段][经历]  1974年2月7日,纳什出生在南非的约翰内斯堡,随后跟随父母辗转于欧洲各地后定居加拿大。小时候的纳什兴趣爱好广泛,足球,篮球,冰球都是他的最爱,他甚至拿过三次国际象棋的冠军,或许这就是他在球场上高智商的根源。曾获得过英属哥伦比亚最有价值足球运动员奖。但值得庆幸的是,纳什最终选择了篮球。否则我们今天就无法领略一代传奇控球后卫的风采了。   高中毕业以后,纳什决定加入NCAA,他和教练向二十几个NCAA的一流大学写了推荐信,但每所大学的回答都是相同的:谢谢,不用了。最终纳什被名不见经传的Santa Clara大学招致门下。至今据说纳什仍保留着那些被退还的信.  1996年,纳什参加NBA选秀,但NBA的球探们普遍不看好纳什,因为他的身体素质不佳,所以纳什仅在第15顺位被太阳选中。在太阳待了两个赛季以后,在1998年选秀大会的当天,小牛用几位替补球员以及一个首轮选秀权从太阳手里换来了NASH.  在小牛队的第一年,纳什并没有找到状态,随之而来的就是达拉斯球迷无情的嘘声。随着库班入主小牛,小牛经历了巨变,三架马车带领小牛一起爆发。在随后的2000—2001赛季,小牛终于在时隔11年之后重反季后赛,从此跻身联盟一线强队之列。   在2004年,或许是宿命的轮回,纳什又回到了凤凰城。接着,太阳队就迎来了铺天盖地,水银泄地,眼花缭乱般的进攻,连续两年MVP,西区决赛,最佳教练等等.纳什带给凤凰城一个又一个惊喜,希望在不久的将来,他能把最大的惊喜带给凤凰城(~~当然是指总冠军咯)。

纳什均衡点是什么,怎么求?

纳什均衡点一般是最大化收益函数。每个参与者的效用函数之间都有相互制约的参数,可以通过迭代的方法(形如第N+1次迭代得到的x1的值=u(第N次迭代得到的x1值)),求出使每个参与者收益函数最大的一组策略。像证明收敛性、纳什均衡存在性及唯一性这种数学证明很难。反正我是没有仔细去看这些。

“纳什均衡” 到底是什么鬼

纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。那么一般犯人都会选择最优的,因为假如不知道对方有没有坦白,也就是假设对方坦白了,那我不坦白我就全被罪名了,那我还不如坦白,这样我要么释放,要么一起判刑,总比对方出卖自己好吧,因为两个人都被关在不同的房间,所以都作出对自己有利的选择,就叫纳什均衡。事实上,如果大家互相信任,都死不承认的话,最多一年,哈哈

什么是纳什均衡?什么是占优策略?以及这两者的区别?

一样的

纳什均衡是什么?

纳什均衡可以这样来理解,如果其他局中人不改变策略,任何一个局中人都不能通过改变自己的策略来得到更大的效用或收益。纳什进一步证明,在有限个局中人参加的有限行为对策中,至少存在一个这样的均衡。

名词:纳什均衡

在给定了竞争对手的行为后,各厂商采取它能采取的最好的策略或行为。也就是说对于给定对方的行动,自己的行动是最有的策略组合。

纳什均衡的优缺点是什么?

所谓纳什均衡,就是双方的策略各自支配,各自得到自己最大的利益,同时还要考虑对方的选择,纳什均衡只是双方博弈的一种结果,就是大家各自满足自己最大利益的策略,关键词 就是最大化利益,很难去说什么优缺点,优点就是双方在一定范围内获得了自己的最大利益, 而缺点就是结果并不是双方想要的最好的结果,有可能是稍差一点的利益。

纳什均衡的含义

纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的 ),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。 所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

什么是纳什均衡?

纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。”也就是说,所有人的战略都是最优的。而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。a,b面临抉择。显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。

名词:纳什均衡

纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。一、举例假定A、B两个企业都生产白酒,白酒分为高度和低度两种。报酬矩阵如图所示:A企业高度低度B企业高度700,600900,1000低度800,900600,800对于B企业来说,A企业如果选择了生产高度白酒,那么B企业会选择生产什么呢?因为800>700,所以B企业会选择生产低度白酒。A企业如果选择了生产低度白酒,因为900>600,那么B企业会选择生产高度白酒。对于A企业来说,如果B企业选择了生产高度白酒,因为1000>600,A企业就会选择生产低度白酒。如果B企业选择了生产低度白酒,因为900>800,A企业就会选择生产高度白酒。这里,A企业的决策取决于B企业的决策,同样B企业的决策取决于A企业的决策。但是A企业选择了生产高度白酒以后,只要不变化,B企业就会选择生产低度白酒不变化。反过来也一样,B企业如果选择了生产高度白酒不变化,A企业就会选择生产低度白酒不变化,这实际上是一个纳什均衡,纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。通俗的讲,就是给定你的最优选择,我会选择能够使我最优的选择,或者说,我选择在给定你的选择的情况下我的最优选择,你选择了给定我选择情况下你的最优选择。这种均衡最后到底均衡在哪一点,由具体情况决定。在存在帕累托改善的情况下,可能会达到帕累托最优。在本例中,B企业选择了生产高度白酒,A企业选择生产低度白酒是一种均衡;B企业选择了生产低度白酒,A企业选择生产高度白酒也是一种均衡。由于在B企业选择生产高度白酒,A企业选择生产低度白酒的时候,A、B两企业的收益都比B企业选择生产低度白酒,A企业选择生产高度白酒时的收益要高,存在着帕累托改善,因此最后可能会达到帕累托最优,即B企业选择生产高度白酒,A企业选择生产低度白酒。1.定义设有n个参与者(n≥2),如果第i个参与者选择Si*时比选择Si时的收益都要好或至少不差。换句话讲,就是在别人都没有变化策略的情况下,i如果变化策略,i就要吃亏。这样Si*就是i的最优策略。即给定别人策略,自己选择最优策略。

什么是纳什均衡

纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。 大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。 于是,两人同时陷入招供还是不招供的两难处境。如果两人均不招供,将最有利,只被判刑三年。 但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供, 这种情况就称为纳氏均衡点。 这时,个体的理性利益选择是与整体的理性利益选择不一致的。   囚犯甲的博弈矩阵   囚犯甲   招供 不招供   囚犯乙 招供 判刑五年 甲判刑十年;乙判刑一年   不招供 甲判刑一年;乙判刑十年 甲判刑三年   基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem) 证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。[来源请求]在数学意义上,纳什并没有超越角谷静夫不动点定理。   经过《美丽心灵》的Sylvia Nasar(书作者)和Ron Howard(电影作者)这样的主流媒体的介入,角谷静夫(Kakutani)在这些人的作品里被完全忽略。有人认为,“纳什平衡”(Nash equilibrium)的更合适的名字应该叫作“角谷静夫—纳什博弈论不动点”(Kakutani-Nash game-theoretic fixed point)或“角谷静夫—纳什平衡”(Kakutani-Nash equilibrium),没有角谷静夫不动点定理,纳什的证明没有多大学术意义。《美丽心灵》完全忽视角谷静夫之关键贡献的作法有待商榷。   第二,纳什的非合作(non-cooperative)博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是,博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为,但冯·诺伊曼(Von Neumann)和纳什的研究是针对两三个节点的小规模博弈论(有人称之为tiny-scale toy case)。   这个假设的不完善处,可能比假设大家都是合作的(cooperative)更严重。因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。最近香港城市大学和北京清华大学的学者群邓小铁、姚期智在基于复杂度理论的大规模博弈论上有所进展,这和纳什小规模博弈论的本质以及《美丽心灵》的广告效果是不可同日而语的。

纳什均衡通俗解释是什么?

纳什均衡通俗解释是:纳什平衡是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什平衡。扩展资料:纳什平衡可以分成两类,“纯战略纳什平衡”和“混合战略纳什平衡”。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。

名词解释纳什均衡

纳什均衡(Nash equilibrium)是博弈论中的一个概念,指的是在一个多人博弈中,所有参与者都选择了自己最优的策略,而没有人能够通过改变自己的策略来获得更多的收益。简而言之,纳什均衡是指博弈中所有参与者的策略组合,使得没有人会单方面改变自己的策略,因为这样做不会获得更多的利益。纳什均衡是一种稳定状态,因为在这种状态下,每个人都认为自己的选择是最佳的,并且无法通过单独改变策略来提高收益。在现实生活中,纳什均衡常常被用来分析各种策略性互动,如市场竞争、国际政治和博弈等。纳什均衡最早由美国数学家约翰·纳什在20世纪50年代提出。他通过研究博弈理论中的非合作博弈,发现了在某些条件下,博弈中存在一种状态,使得所有参与者都选择最优的策略,这种状态被称为纳什均衡。在纳什均衡中,每个人都是理性的,并且能够预测其他人的行为。因此,他们会选择自己的最优策略,而不会被其他人的策略所影响。虽然纳什均衡不一定是最优的结果,但它是一种稳定状态,因为在这种状态下,没有人有动机改变自己的策略。在博弈论中,纳什均衡是一种重要的分析工具,可以用来研究各种策略性互动的结果。通过分析不同参与者的策略选择,可以预测博弈的结果,并帮助人们做出更好的决策。在实际应用中,纳什均衡被广泛用于分析市场竞争、战略联盟、投标竞争和国际政治等领域。

什么是纳什均衡?

纳什均衡理论又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略。则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料纳什均衡理论创始人约翰·纳什介绍——1928年6月13日—2015年5月23日,提出纳什均衡的概念和均衡存在定理,是著名经济学家、《美丽心灵》男主角原型,前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。参考资料来源:百度百科——纳什均衡

博弈论——纳什均衡

纳什均衡,Nash equilibrium,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。——百度百科。 简单地说,纳什均衡就是别人采取那样的策略,我不得不采取这样的策略,在别人不改变策略的情况下,我也无法采取别的策略,如如形成了一种“非合作博弈均衡”。 你可能听说过这个故事。老师让全班所有的同学想一个0到100之间的整数,说谁想的数字最接近全班平均值的2/3,谁就获胜。那么聪明的学生就会这么想:假设如果全班的同学都随机选了一个数字,那么平均值就是50,我的答案应该是50的2/3,也就是33;如果再进一步想,如果大部分的同学都足够聪明,想的也是33,那么平均值就变成了33,那么更聪明的我答案就要变成22。但是如果全班的同学也足够聪明,想到了22,那么我的答案就是22/3*2=14。所以假定所有的学生都会这一样一步一步的推理,最后得出的答案就是0。而事实上没有哪个班的学生能聪明到这个程度,也就是给那个最极端的答案0. 生活中的大多数人也不会聪明到那个程度,去做那个极端的推理并执行。但是博弈论可以帮助我们理解社会上一个看似复杂又矛盾的现象。比如为中小学生“减负”的呼声一直没断过,中学生作业多、任务重已成为一个事实,很多学生晚上要花3个小时甚至4个小时做作业,到了晚上11点、12点还不能睡觉,周末的各学科的练习卷会有十几二十份,根本没有玩的时间。但是与此同时,在周末或者晚上很多家长又把孩子送出去加各种各样的兴趣班、辅导班。这不是让孩子的负担更重了吗?难道大多数的家长不知道孩子的学业已经很沉重了吗? 难道学校的想布置这么多作业吗?难道学习喜欢做作业到深夜吗?难道家长喜欢晚上周末不怨其烦的送孩子去各种班吗?答案当然都是不是。有人这些都是被逼的。不错,其实这是三个“纳什均衡”。 先看学校的老师为什么要布置这么多的作业。那是因为别的学校也布置了那么多的作业。如果自己的学科不布置那么多的作业,那么学生的各项学科技能(考试成绩)将落后于同一地区的兄弟学校。这是老师不远看到的,也是学校领导不愿意遇见的,很多时候也是家长的意愿,即想看到我的孩子有个好成绩。 再看学生为什么不得不完成那么多的作业。其实也是被逼的。同班同学都完成了,为什么你完不成?这是老师的责问。同班同学都完成了,为什么我完不成?这是自我能力的怀疑。所以孩子们都孜孜不倦地完成了一天数个小时的作业量。完不成的孩子,要么已经完成了自我否定,破罐子破摔,成了老师、家长眼中的“差生”;要么鼓起勇气对抗到底,成了老师、家长眼中的“顽劣”、熊孩子。 最后家长为什么要送孩子去各种兴趣班、辅导班。那是因为别的家长也把孩子送过去了。别家的孩子去某某钢琴班,考了个十级被某学校提前录取了;那家的孩子去了舞蹈班拿了个金奖,都去北京演出了;哪家的孩子去了哪个辅导班,成绩一下子提高了30分,上次考试都进了班级前10名。所以没有哪个家长是做得住的,不管孩子有多少兴趣,有没有时间玩自己的游戏,都得送过去。 理解了博弈论中“纳什均衡”,可以帮助我们懂得人生中的很多无奈。我想这也是自我修养的一种提升。

什么是纳什均衡?

纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。参考资料来源:百度百科-纳什平衡

纳什均衡是什么?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡
 1 2  下一页  尾页