本文共 1707 字,大约阅读时间需要 5 分钟。
title: 博弈论 斯坦福game theory stanford week 4-1
tags: note notebook: 6- 英文课程-15-game theory ---他的形式是这样的,一个博弈者向另外一个博弈者提供一个价格,另一个决策者选择是否接受,如果不接受那么两个人将会什么都得不到。
如果接受,那么1得到10-x,2得到x
在上述条件下,我们可以推论玩家2可能会接受所有的可能的x,如果玩家1让x=0,他都有可能会接受。在这样的条件下,玩家1会不会接受0主要取决于玩家2会不会接受0.
但是在实际的博弈中并非是这样的,更多的人愿意选择和接受5
子游戏的完美性也许有时候并不适应整个的现实,但是他会帮助我们深入的理解博弈的本质。
有些的情况是十分难以解决的:比如下棋。并且我们很难相信人类是完全通过逻辑来解决下期问题的。这需要经验和灵感。
我们考虑扑克游戏,在玩扑克游戏的时候,人们相互之间进行博弈,但是他们每个人都不能掌握完整的信息。
在扑克中:
我们有很多不同的手牌
有很多不同的策略
并且我们很难通过画出树状图的形式来描述这个游戏,我们对于这种游戏可以学习很多。
我们之前分析的情况是每个人都知道其他人的选择,我们使用树形结构来对这些情况进行描写。但是在我们之前讨论的棋牌游戏中,我们无法知道别人可以进行的选择。所以我们定义不完整信息博弈的情况如下。
可以看到,定义和之前的很像。
我们举个例子:
在这样的博弈中,我们看到博弈者1有两个选择节点。由于他的信息并不能提前得到,因此他在第二次选择的时候只能选择一种情况。l 和 r。
因此博弈者一只有四种选择的可能分别是:
Ll,Lr,Rl,Rr
同样的我们可以用这种形式描述任何的一般形式的博弈。
比如我们之前用过的TCP问题。
和之前的方法相同,我们可以为所有的博弈找到他们的纯策略。
混合策略和纯策略都可以用原来的定义进行描述,
在这样的情况下,我们可以定义将一个深度很高的树,转化为一个很宽的树,同样的我们可以将一个很宽的树转化成一个深度很高的树。
我们在解决不完整信息博弈问题中有两种主要的策略,一种是混合策略,一种是行为策略。
混合策略是随机使用所有的纯策略
行为策略,还是用这个博弈作为例子,我们来看下行为策略是什么样的。
行为策略这样描述,选择A的概率是0.5,选择G的概率是0.3。
混合策略是这样的:0.6选择(AG),0.4选择GH。
看起来这两种策略的形式十分的相似,可以进行相互的转化,
在这样的一个博弈中,我们有以下几点可以得到:
那么在行为策略中的均衡在哪里呢?
同样的,我们可以知道,D是占优的。如果我们使用行为策略,我们可以使用列方程的形式进行衡量。
可以接触
在不完整信息博弈中可能没有合适的子问题,不过我们可以进行推理。
在这样的问题中,我们带入如下的情景:
我们分析,无论公司是强是弱,他选择进入领域,如果他的对手与之争斗他都会遭到损失,在这样的情况下,他不会选择进入这个领域,所以在这个情景内。公司不会进入这个领域。
因此均衡出现在:
这个条件下。
但是如果我们这样考虑,考虑公司2的选择,他选择与之竞争一定会造成损失。那么他如果选择接受呢?
如果新的公司是强大的,那么他会选择进入,因为这有更大的收益,如果不强大,那么他会选择不进入。
这是另外一个纳什均衡。
人们在很多情况是根据他们的估计和信念进行选择的。就像前面的博弈,有两个纳什均衡,但是具体会走向那个纳什均衡,要看他么之间的估计和信念。
转载地址:http://aibvx.baihongyu.com/