纳什均衡论纳什均衡怎么算纳什均衡与博弈论

一：纳什均衡理论的内容是什么？

纳什均衡”：合作是有利的“利己策略”。它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。 1994年诺贝尔经济学奖的获得者美国普林斯顿大学的约翰·纳什。纳什获得诺贝尔经济学奖的原因是他在博奕沦领域的贡献，他提出了“纳什均衡”理论、关于博奕论，流传最广的是一个叫做“囚徒困境”的故事：话说有一天，一个富翁在家中被杀，财物被盗；警方在此案的侦破过程中，抓到两个犯罪嫌疑人张三和李四，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称他们只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。警察分别对张三和李四说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们1年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你3个月的监禁，但你的同伙要被判10年刑。如果你拒不坦白，而被同伙检举，那么你就将被判10年刑，他只判3个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。” 张三和李四怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供，按照亚当·斯密的理论，每一个人都是一个“理性的经济人”，都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程：假如他招了，我不招，得坐10年监狱，招了才5年，所以招了划算；假如我招了，他也招，得坐5年，他要是不招，我就只坐3个月，而他会坐10年牢，也是招了划算。综合以上几种情况考虑，不管他招不招，对我而言都是招了划算。两个人都会动这样的脑筋，最终，两个人都选择了招?结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局 (被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题，这就是个人理性与集体理性的矛盾。实际上，如果两个都抵赖，各判刑1年，显然比都判5年好，但实际上做不到，因为它不满足个人理性要求。作为一个理性的人，张三和李四都会想，如果我抵赖而对方坦白的话，自己就可能判刑10年，理性的人是不会冒这种险的。但张三和李四都理性选择的结果，两人都被判了5年，最优的被判1年的结果并没有出现。也就是说，对每个人而言都是理性的选择，但对于整个集体来说却是不理性的。这与传统经济学所言的结论相悖。传统经济学认为市场经济存在“看不见的手”，它调节的结果是每个人的理性选择最终会造成对整个集体的最大利益。实际上，就像囚徒困境一样，这只看不见的手在参与选择的人数只有少数几个的时候会失去作用，因为这个时候，人们决策的过程会考虑其他参与者的想法，就像赌博和下棋的时候一样，这就和买家和卖家数量都巨大时的完全竞争不完全一样，需要新的一套思路进行研究。在上面的例子中，我们注意到了一个并非最优的结果，就是两人都选择坦白的策略以及因此被判5年的结果，这个结果被称为“纳什均衡”，也叫非合作均衡。博奕论中最基本的概念就是“纳什均衡”，一谈到博奕论，人们说的最多的最著名的也是“纳什均衡”。纳什均衡指的是这样一种战略组合，这种战略组合由所有参与人的最优战略组成，也就是说，给定别人战略的情况下，没有任何单个参与人有积极性选择其他战略使自己获得更大利益，从而没有任何人有积极性打破这种均衡。当然，“纳什均衡”虽然是由单个人的最优战略组成，但并不意味着是一个总体最优的结果。如上述，在个人理性与集体理性的冲突的情况下，各人追求利己行......余下全文>>

二：博弈论基础和纳什均衡与博弈论哪个好

约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。

博弈论亦名对策论、赛局理论，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

纳什均衡：又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰-纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略，从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。

三：您可以简洁地介绍一下纳什均衡论吗？谢谢

纳什均衡是一种策略组合，使得每个参与人的策略是对其他参与人策略的最优反应。

假设有n个局中人参与博弈，如果某情况下无一参与者可以独自行动而增加收益（即为了自身利益的最大化，没有任何单独的一方愿意改变其策略的），则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡，从实质上说，是一种非合作博弈状态。

纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态，需要注意的是，只有最优策略才可以达成纳什均衡，严格劣势策略不可能成为最佳对策，而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡，而囚徒困境中有且只有一个纳什均衡。

数学定义

纳什均衡的定义：在博弈G=﹛S1,…,Sn：u1,…，un﹜中，如果由各个博弈方的各一个策略组成的某个策略组合（s1*,…，sn*）中，任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…，sn*）的最佳对策，也即ui（s1*,…s*i-1,si*,s*i+1,…，sn*）≥ui（s1*,…s*i-1,sij*,s*i+1,…，sn*）对任意sij∈Si都成立，则称（s1*,…，sn*）为G的一个纳什均衡。

经济学定义

所谓纳什均衡，指的是参与人的这样一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。换句话说，如果在一个策略组合上，当所有其他人都不改变策略时，没有人会改变自己的策略，则该策略组合就是一个纳什均衡。

四：怎么用简洁易懂的语言描述什么是纳什均衡理论

通俗地说，纳什均衡的含义就是：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。在纳什均衡中，每一个理性的参与者都不会有单独改变策略的冲动。处类似“囚徒困境”这样的博弈中，背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡结果，就是双方参与者都背叛对方。试想一个简单的博弈，张三和李四这两个员工都想要加薪。假如只有一个员工要求加薪，老板会答应：但要是两个人都要求加薪，老板就会生气，并把两个人统统开除。这场博弈有两个纳什均衡，一个是只有张三要求加薪，另一个是只有李四要求加薪。两个员工都不要求加薪并不是纳什均衡，因为当两个人知道对方没有提出要求时，就会后悔自己的选择。两个人都要求加薪也不是纳什均衡，因为两个人事后都会后悔自己被开除。稳定而自私的结果，就是一个纳什均衡。

五：博弈论中的均衡和纳什均衡怎么理解？ 10分

1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石，后来的博弈论研究基本上都沿着这条主线展开的。然而，纳什天才的发现却遭到冯·诺依曼的断然否定，在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性，使纳什坚持了自己的观点，终成一代大师。要不是30多年的严重精神病折磨，恐怕他早已站在诺贝尔奖的领奖台上了，而且也绝不会与其他人分享这一殊荣。

纳什是一个非常天才的数学家，他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而，他的天才发现———非合作博弈的均衡，即“纳什均衡”并不是一帆风顺的。　　1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵，大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论，而且发明了计算机。早在20世纪初，塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达，直到1939年，冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)，并与其合作才使博弈论进入经济学的广阔领域。　　1

944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版，标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如，1838年古诺(Cournot)简单双寡头垄断博弈；1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断；2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的，片断的研究，带有很大的偶然性，很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而，诺依曼的博弈论的局限性也日益暴露出来，由于它过于抽象，使应用范围受到很大限制，在很长时间里，人们对博弈论的研究知之甚少，只是少数数学家的专利，所以，影响力很有限。正是在这个时候，非合作博弈———“纳什均衡”应运而生了，它标志着博弈论的新时代的开始！纳什不是一个按部就班的学生，他经常旷课。据他的同学们回忆，他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课，但纳什争辩说，至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者，可是，没上几次课，纳什就认定这门课不符合他的口味。于是，又走人了。然而，纳什毕竟是一位英才天纵的非凡人物，他广泛涉猎数学王国的每一个分支，如拓扑学、代数几何学、逻辑学、博弈论等等，深深地为之着迷。纳什经常显示出他与众不同的自信和自负，充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试，他的博弈论研究工作被迫中断，他感到这是莫大的浪费。殊不知这种暂时的“放弃”，使原来模糊、杂乱和无绪的若干念头，在潜意识的持续思考下，逐步形成一条清晰的脉络，突然来了灵感！这一年的10月，他骤感才思潮涌，梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡......余下全文>>

六：混合策略纳什均衡的原理

严格占优策略均衡、重复剔除的占优策略均衡、纯策略纳什均衡和混合策略纳什均衡。一般将上述四种均衡统称为纳什均衡。在这四种均衡概念中每种均衡依次是前一种均衡的扩展。前一种均衡是后一种均衡的特例。严格占优策略均衡是重复剔除的占优策略均衡的特例；重复剔除的占优策略均衡是纯策略纳什均衡的特例；纯策略纳什均衡是混合策略纳什均衡的特例。如果将完全信息静态博弈中存在某种均衡的所有博弈定义为一个集合，那么就存在前一种均衡的博弈集合是后一种均衡的博弈集合的子集。完全信息静态博弈四种均衡概念之间的关系可以用图2—13表示。

七：一个静态博弈中，纯策略纳什均衡一定存在对吗

全世界经过了半个多世纪对纳什均衡的研究，纳什他本人和全世界的人都没找到理由解释纳什均衡，怎么单方占优，怎么博弈取胜。

今日我们用博弈科学的发展眼光再看博弈论、矛盾论、概率论，还有所谓的经济学名著，无论多么伟大的经济学天才，使用上述的这些理论，都不知道怎么占优，不知道怎么能赢。

以往谈囚徒困境和纳什均衡的人都是用一个模糊的概念搬来搬去，坐在办公室里凭空假想，对天论道，从无知到无聊争论了半个多世纪。

更为讽刺的是，一本本博弈论著作，古老的内容千篇一律，里面没有几句精彩的话，没有几个经典的词，更没有定理、定律、定义和法则。至今一个个博弈论专家、矛盾论专家、概率论专家和外行知道得一样多。

纳什均衡论