当前位置: 主页 > 生活杂文 >

⭐纯策略纳什均衡计算-怎么求纯策略纳什均衡和混合纳什策略

最近网络热点文章💠《纯策略纳什均衡计算-怎么求纯策略纳什均衡和混合纳什策略》,很多网友都想阅读✨纯策略纳什均衡计算-怎么求纯策略纳什均衡和混合纳什策略的详细内容,芒果文学(www.mangowenxue.com)编辑精心收集整理了相关内容,希望大家都能开心的阅读。

本篇文章给大家谈谈纯策略纳什均衡,以及纯策略纳什均衡计算对应的知识点,希望对各位有所帮助,不要忘了收藏本站!

内容导航:
  • 怎么求纯策略纳什均衡和混合纳什策略
  • 什么情况下至少存在三个纯策略纳什均衡?
  • 怎么求纯策略纳什均衡和混合纳什策略?
  • 纯战略纳什均衡
  • 什么是纳什均衡理论?
  • 怎么求纯策略纳什均衡和混合纳什策略

Q1:怎么求纯策略纳什均衡和混合纳什策略

纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,最后两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。



混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。


Q2:什么情况下至少存在三个纯策略纳什均衡?

c中至少存在三个纯策略的纳什均衡。 


猎鹿博弈(Stag Hunt Game, SHG)又称猎鹿模型(Stag Hunt Model)、猎人的帕累托效率、安全博弈(Assurance Game)、协调博弈(Coordination Game),对应于信任困境(Trust Dilemma)。


其源自法国启蒙思想家卢梭(Jean-Jacques Rousseau)的著作《论人类不平等的起源和基础》中的一个故事。


两个人出去打猎,猎物为鹿和兔,他们互不知道对方选择的猎物。如果选择鹿,则需要另一人也选择鹿,产生合作才能成功狩猎。而选择兔为猎物,不需要合作也能成功,但是猎兔的收益要小于猎鹿。


介绍


猎鹿博弈(Stag Hunt Game, SHG)区别于囚徒困境(Prisoner's Dilemma, PD),SHG有两种纯策略纳什均衡:全合作或全背叛,而在PD中,尽管全合作是帕累托最优,但只有全背叛才能达到纳什均衡。

Q3:怎么求纯策略纳什均衡和混合纳什策略?

纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,最后两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。



混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。


Q4:纯战略纳什均衡

房地产开发博弈

房地产开发博弈、警察捉小偷与混和策略

实际上,在每个参与人都有优势策略的情况下,优势策略均衡是非常合乎逻辑的。一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。

假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

但遗憾的是,并不是所有博弈都有优势策略,哪怕这个博弈只有两个参与者。实际上,优势策略只是博弈论的一种特例。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。

来看这样一个房地产开发博弈的例子。假定北京市的房地产市场需求有限,A、B两个开发商都想开发一定规模的房地产,但是市场对房地产的需求只能满足一个房地产的开发量,而且,每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下,无论是对开发商A还是开发商B,都不存在一种策略完全优于另一种策略,也不存在一个策略完全劣于另一个策略。

因为,如果A选择开发,则B的最优策略是不开发;如果A选择不开发,则B的最优策略是开发;类似地,如果B选择开发,则A的最优策略是不开发;如果B选择不开发,则A的最优策略是开发。这样就形成了一个循环选择。

根据纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。

这个博弈的纳什均衡点不止一个,而是两个:要么A选择开发,B不开发;要么A选择不开发,B选择开发。在这种情况下,A与B都不存在优势策略,也就是A和B不可能只要选择某一个策略而不考虑对方的所选择的策略。实际上,在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在房地产博弈中,我们无法知道,最后结果是A开发B不开发,还是A不开发B开发。

再来看这样一个警察捉小偷博弈的例子。某个村庄上只有一名警察,他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B,A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知。

因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在某家看守财产,而小偷也选择了去该富户家,就会被警察抓住;若警察没有看守财产的富户家而小偷去了,则小偷偷盗成功。

一般人会凭着感觉认为,警察当然应该看守富户A家财产,因为A有2万元的财产,而B只有1万元的财产。实际上,对于警察的一个最好的做法是,警察抽签决定去A家还是B家。

因为A家的财产是B家的2倍,小偷自然光顾A家的概率要高于B家,不妨用两个签代表A家,比如如果抽到1、2号签去A家,抽到3号签去B家。这样警察有2/3的机会去A家做看守,1/3的机会去B家做看守。

而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗,只是抽到1、2号签去A家,抽到3号签去B家,那么,小偷有l/3的机会去A家,2/3的机会去B家。这些数值是可以通过联立方程准确计算出的,笔者这里就不给出具体的数学计算过程了。

细心的读者会发现,警察捉小偷博弈与前面所举的两个博弈案例有一个很大的差别,就是用到了概率的知识,警察与小偷没有一个一定要选择某个策略的纳什均衡,而只有选择某个策略是多少几率的纳什均衡。

在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。

用专业的话来说,所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点。

所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。

最常见混和策略就是猜硬币游戏。比如在足球比赛开场,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的,概率应该都是1/2。那么,猜硬币游戏的参与者都是1/2的概率选择正与反,这时博弈达到混和策略纳什均衡。

再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”、还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大,那么这个对弈者在游戏中输的可能性就增大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。

由此可见,纯策略是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。

在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略.

Ø通过了一学期的博弈论学习, 在日常生活中,知道可以凭借博弈论与信息经济学的思想方法来分析进而解决实际问题.日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。

孙子兵法》上说:“知己知彼,百战百胜。”可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中,博弈双方都明白对方的策略,从博弈理论来说,更拗口的说法是一方知道另一方知道自己的策略,反之另一方亦然,这种句法我们可以一直这么用下去,一直用到打“……”,而这正是博弈双方所掌握的公共信息。

因此我们可以了解到,形成一个博弈有4个要素:

1.博弈要有2个或2个以上的参与者(Player)。在博弈中存在一个必须的因素,那就是不是一个人在一个毫无干扰的真空里做出决策。比如一个单身汉,就不可能存在夫妻吵架的博弈,更不存在是否送花讨太太欢心的困扰。

从经济学的角度来看,如果是一个人做决策而不受到他人干扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,也就是一个人或一个企业在一个既定的局面或情况下如何决策的问题。

任何理论与方法都不是万能的。博弈论亦然,它不可能包治百病。

Q5:什么是纳什均衡理论?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。


当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。


扩展资料;


纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。


要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。


所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。


混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。


当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。


因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。


然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。


参考资料来源;百度百科——纳什平衡

Q6:怎么求纯策略纳什均衡和混合纳什策略

纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,最后两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。



混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。


关于纯策略纳什均衡和纯策略纳什均衡计算的介绍到此就结束了,不知道你从中找到你需要的信息了吗?如果你还想了解更多这方面的信息,记得收藏关注本站。

发布时间:2024-01-26 22:07

上述文字是💠《纯策略纳什均衡计算-怎么求纯策略纳什均衡和混合纳什策略》✨的美文内容,大家如想要阅读更多的短文学、文学名著、精品散文、诗歌等作品,请点击本站其他文章进行赏析。

版权声明:本文由互联网用户自发贡献,该文仅代表作者观点。芒果文学仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件进行举报,一经核实本站将立刻删除。

相关文章阅读

腾讯王卡抖音免流量吗

腾讯王卡抖音不免流量。大王卡只针对腾讯应用和腾讯游戏应用专属流量免费,抖音不属于腾讯业务,使用时按照日租宝扣费,因此不免流量。 免流应用包括:微信、手机QQ、QQ轻聊版...

[生活杂文] - 2023-06-17 23:15:33

定西歌词解析(我走过你走的路这算不算相逢什么歌)

本篇文章给大家谈谈定西歌词,以及定西歌词解析对应的知识点,希望对各位有所帮助,不要忘了收藏本站! 内容导航: 你听过哪些很扎心的句子或歌词? 民谣歌词 有关民谣歌词 我走...

[生活杂文] - 2023-05-31 00:10:37

教练车营运贴怎么贴

1、清洗车身需要粘贴的位置,有条件的可使用无纤维脱落布蘸50%的酒精或异丙醇或丙酮擦洗,也可使用肥皂水。 2、需要等酒精或清洗剂完全挥发后才能粘贴,缓慢的贴,同时使用工具...

[生活杂文] - 2023-02-11 22:12:44

大S和小S分别是谁

大S小S指的是徐熙媛和徐熙娣姐妹两个,她们最初是以SOS演唱组合的方式进入演艺圈,后来改为ASOS,为了区分姐妹两人,媒体和歌迷们喜欢称呼她们为大S和小S,久而久之也就成为她们...

[生活杂文] - 2023-03-01 20:25:47

女人梦见自己打吊瓶针头脱落,女人梦见自己打吊瓶是什么意思

只一次做这样的梦很正常,没什么预示,如非要讲预示那就跟你说,这个说明有可能你睡觉的时候姿势不对,血流通不畅或者其它原因,像经脉抽了一下等引起的疼痛,由大脑做梦中显示出来...

[生活杂文] - 2023-10-13 10:51:41

带金链子墨镜的软件是什么,带金链子墨镜的软件有哪些

freestyle短视频就是这样的app ,可以去各大应用市场下载 你是想编辑视频吧,下载个AE(Adobe After Effects)就可以做了,这个软件会把视频时间轴分离出来,选到你想加东西的那一秒,然...

[生活杂文] - 2023-10-26 17:46:17

ai3,ai3怎么操作?

本篇文章给大家谈谈ai3,以及对应的知识点,希望对各位有所帮助,不要忘了收藏本站! 内容导航: ai3win10更新后变卡,加入d3d9文件后游戏运行不了了! ai3怎么操作? AI3 内存修改器怎么...

[生活杂文] - 2023-10-06 19:42:19

国家发展改革委农经司:保障顺利完成今明两年国债项目建设任务

10月27日,国家发展改革委农经司副司长、一级巡视员邱天朝接受采访时表示,下一步,将坚持“资金要素跟着项目走”的基本原则,认真做好国债项目筛选审核、组织实施、监督管理等...

[生活杂文] - 2023-11-16 10:01:48

国家邮政局:1

据国家邮政局微信公众号消息,经测算,2024年1-2月中国快递发展指数为329.6,同比提升26.7%。其中发展规模指数、服务质量指数和发展能力指数分别为407.1、459.3、210.1,同比分别增长2...

[生活杂文] - 2024-03-15 18:02:39

大货车过湾最小宽度

本文目录一览: 1、6.8米货车转弯路面至少多宽 2、17.5车需要多宽道能拐直角弯 3、4.2米货车转弯半径 4、40尺集装箱车的最小转弯半径多少,比较急用 6.8米货车转弯路面至少多宽 6.8米货...

[生活杂文] - 2024-02-16 17:55:34

一年级的孩子怎么教育方法如下

导读:我家孩子今年才上一年级,家里面很注重孩子的教育,但是由于我平常不怎么在家,孩子都是爷爷奶奶带着,我和孩子的爸爸也不知道,一年级的孩子怎么教育方法如下。应该怎...

[生活杂文] - 2024-03-15 22:44:57

茄子和海带能一起吃吗 茄子和海带相克吗

导读:茄子和海带能一起吃吗?以下由小编为大家带来介绍。1、茄子和海带能一起吃。2、从食物性味上来看,茄子性凉,味甘,而海带性寒,味甘,咸,两者性味相似,并不冲突,但...

[生活杂文] - 2023-03-30 18:39:04

婚前买房两人的名字都要写吗

导读:房子现在已经成为婚姻的一定基础了,虽然不是绝对,但是很多人都会想在婚前把房子解决了。那么婚前买房两人的名字都要写吗? 主要是看双方两人对于房子划分的情况,如果...

[生活杂文] - 2023-07-03 02:48:11

微博王者荣耀代练编号怎么弄 王者荣耀代练多少钱一颗星

王者荣耀代练是一个新兴的职业,不少游戏爱好者都想通过此途径来挣钱,而微博似乎就是一个很好的途径。那么微博王者荣耀代练编号怎么弄呢?来看看吧! 微博王者荣耀代练编号怎...

[生活杂文] - 2023-04-07 10:19:53

超原子半导体创下速度与效率纪录

半导体已经变得无处不在,但它们也有局限性。半导体中会产生激子,这意味着能量以热的形式损失,信息传输是有速度限制的。发表在26日《科学》杂志的论文中,美国哥伦比亚大学...

[生活杂文] - 2023-10-27 10:01:20

乌梁素海综合治理,让“塞外明珠”重现光彩

芦苇随风摇曳,被秋风染上点点金黄;水鸟啾啾鸣唱,或游弋水面或翱翔天空……秋日的乌梁素海,生机勃勃,景色宜人。 日前,记者随中华环保世纪行2023年宣传活动采访团来到内蒙...

[生活杂文] - 2023-09-11 10:03:27
文章阅读TOP10
猜你喜欢