纳什平衡11大優點2024!(震驚真相)
因此,很多非对称博弈场景很难利用纳什均衡实现。 在多智能体 AI 系统中这一点尤为重要,这需要在解决方案的数学优雅性和实现的可行性中找到合适的平衡。 对于一个局中人,如果他的每次决策只能选择某个特定的行为,则称这种情形为纯策略;如果局中人可以依据某种概率分布在每次决策中选定不同的行为,则称之为混合策略. 尽管“大猪”“小猪”只要了解自身处境,采取相应的策略就会成功,然而理性是有限的,确定的成功总是很难获得。 当然股市中的金融机构要比模型中的大猪聪明的多,并且不守游戏规则,他们不会甘心为小猪们踩踏板。 事实上,他们往往会选择破坏这个博弈的规矩,甚至重新建立新规则。 遗憾的是,在股市中,很多作为“小猪”的散户不知道要采取等待策略。 纳什平衡: 纳什均衡分类 纳什均衡是一个优美且强大的数学模型,它可以解决很多博弈论问题,但在一些对称博弈环境中捉襟见肘。 对于初学者而言,纳什方法假设玩家具备无限的计算能力,而现实环境中几乎不存在这种情况。 注:博弈论也称Game Theory,一场博弈用G表示,Si表示博弈方i的策略,ui表示收益。 现在我们以GOO公司为第一人称视角来思考应对SAM公司的博弈策略。 考虑一下博弈论中最经典的例子:囚徒困境(The Prisoner’s Dilemma )。 这个例子解释了在存在共同或互斥利益、共同合作行为的场景下,参与者是如何考虑其个人利益的。 对称博弈统治 AI 世界,其中大多数基于 20 世纪最著名的数学理论之一:纳什均衡。 纳什均衡以美国数学家 John Forbes Nash 命名。 本质上,纳什均衡描述了这样的场景:每个玩家选择一个策略,当一个玩家不改变策略时,没有玩家能从改变策略中获益。 纳什平衡: 纳什均衡(Nash equilibrium)及经典案例 博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。 纳什平衡 即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 尽管纳什均衡对博弈论和经济理论有极为重要的作用,但从前文的证明过程中不难发现,纳什存在定理有一定的局限性:如果选择的集合是无限或非紧的集合,纳什均衡是完全可以不存在的。 事實上,这样两人都选择坦白的策略以及因此被判两年的结局被稱作是“纳什均衡”(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。 需要注意,平衡局势的定义中是根据效用值进行判断,而不是效用期望,所以既可以针对纯策略,也可以针对混合策略. 虽然也有纯策略纳什均衡,但根据矩阵对策的结果,纯策略意义下的平衡局势可能不存在. 注:经济学定义从字面上还是相对比较好理解的;这里稍微解释一下数学定义,博弈论也称Game Theory,一场博弈用G表示,Si表示博弈方i的策略,ui表示收益。 以两家公司的价格大战为例,价格大战存在着两败俱伤的可能,在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。 于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案。 纳什平衡: 6日 纳什均衡理论 Players(参与者):是指参与到游戏中的具有理智的实体。 例如拍卖会上的竞价者、玩剪刀-石头-布的玩家、参加竞选的政客。 举例来说,两个玩家同时说出数字,说出更大数字的玩家获胜;或者,两个玩家同时说出小于1的实数,说出更大数字的玩家获胜。 显然,这两个博弈不存在纳什均衡,而类似的例子还有很多。 纳什平衡 纳什平衡 … Read more