完美贝叶斯均衡
一、核心定义
完美贝叶斯均衡(Perfect Bayesian Equilibrium, PBE)是动态不完全信息博弈的解概念,要求参与者的策略在每个信息集上都是最优的,且信念通过贝叶斯法则从策略中推导出来。PBE是纳什均衡和子博弈完美均衡在不完全信息博弈中的扩展。
基本要素:
- 策略:
,每个参与者的完整行动计划 - 信念:
,在每个信息集上对节点的概率分布 - 信息集:参与者无法区分的决策节点集合
数学表达:
完美贝叶斯均衡
序贯理性(Sequential Rationality):
对所有信息集
和参与者 信念一致性(Belief Consistency): 在均衡路径上,信念由贝叶斯法则确定:
二、理论推导 / 核心逻辑
与其他均衡概念的关系:
- 纳什均衡:策略互为最优反应,但不要求序贯理性
- 子博弈完美均衡:完全信息动态博弈,要求每个子博弈都是纳什均衡
- 完美贝叶斯均衡:不完全信息动态博弈,要求序贯理性+信念一致性
PBE的求解步骤:
- 识别信息集:确定参与者无法区分的节点
- 指定策略:每个参与者在每个信息集的行动
- 推导信念:使用贝叶斯法则(在均衡路径上)
- 检验序贯理性:给定信念,策略是否最优
- 检验一致性:信念是否由策略推导
贝叶斯法则应用:
假设信息集
先验概率:
观察到信号
离均衡路径信念:
在均衡路径外,贝叶斯法则不适用,需要额外限制:
- 弱完美贝叶斯均衡:任意信念
- 序贯均衡:信念是完全混合策略的极限
- 直觉标准:排除不合理信念
三、关键结论
- PBE要求策略在每个信息集上都是最优的(序贯理性)
- 信念必须与策略一致(通过贝叶斯法则)
- PBE是完全信息子博弈完美均衡的推广
- PBE可能存在多重均衡
- 离均衡路径信念的选择影响均衡结果
- 精炼标准(如直觉标准)可减少均衡数量
- PBE广泛应用于信号博弈、声誉模型、讨价还价等
四、图形解释
信息集示意图:
自然(0.5/0.5)
/ \
类型1 类型2
| |
发送者 发送者
/ \ / \
L R L R
| | | |
接收者 接收者 接收者 接收者
(信息集:无法区分来自类型1还是类型2)贝叶斯更新:
- 先验:
- 观察到信号
- 后验:
序贯理性检验:
在每个信息集,给定信念
五、例子(现实或数值)
例子1:啤酒-烈酒博弈(Beer-Quiche Game)
设定:
两种类型决斗者:
- 强硬型(Strong):比例
- 软弱型(Weak):比例
早餐选择(信号):
- 啤酒(Beer)
- 烈酒(Quiche)
偏好:
- 强硬型偏好啤酒
- 软弱型偏好烈酒
挑战者观察早餐,决定是否决斗(Duel)或不决斗(Not)
支付:
- 决斗者:避免决斗更好(如果软弱),决斗无所谓(如果强硬)
- 挑战者:只想与软弱型决斗
分离均衡:
策略:
- 强硬型选择啤酒
- 软弱型选择烈酒
- 挑战者:啤酒→不决斗,烈酒→决斗
信念:
序贯理性:
- 强硬型:选择啤酒(偏好)且避免决斗 ✓
- 软弱型:选择烈酒(偏好)虽然引发决斗,但如果选啤酒会被认为强硬...
问题:软弱型有激励偏离到啤酒,假装强硬!
混同均衡:
策略:
- 两种类型都选择啤酒
- 挑战者:啤酒→不决斗,烈酒→决斗
信念:
(离均衡路径)
序贯理性:
- 挑战者看到啤酒:期望对手强硬概率0.1,不决斗 ✓
- 软弱型:选啤酒避免决斗,虽然不喜欢啤酒 ✓
- 强硬型:选啤酒(偏好) ✓
这是PBE!
例子2:市场进入博弈
设定:
在位企业类型:
- 强势(Strong):成本低,比例
- 弱势(Weak):成本高,比例
进入者观察在位企业的产量
支付:
- 强势企业:高产量成本低
- 弱势企业:高产量成本高
- 进入者:只想在对手弱势时进入
分离均衡:
策略:
- 强势:
- 弱势:
- 进入者:
不进入, 进入
信念:
序贯理性:
- 强势选择100(利润最大化且阻止进入) ✓
- 弱势选择60(高产量成本太高) ✓
- 进入者根据产量推断类型 ✓
例子3:教育信号(简化版)
设定:
工人类型:
- 高能力:
,生产率 ,比例 - 低能力:
,生产率 ,比例
教育成本:
- 高能力:
- 低能力:
雇主观察教育
分离均衡:
策略:
- 高能力:
- 低能力:
- 雇主:
,
信念:
激励相容:
- 高能力:
✗
需要调整!
- 高能力:
(无差异) - 低能力:
✓
例子4:讨价还价(不完全信息)
设定:
卖家成本:
- 低成本:
,比例 - 高成本:
,比例
买家估值:
卖家先报价
分离均衡:
策略:
- 低成本:
- 高成本:
- 买家:接受
信念:
序贯理性:
- 低成本:
(不模仿高成本: )✗
低成本有激励模仿高成本!
混同均衡:
策略:
- 两种类型都报价
- 买家:接受
信念:
序贯理性:
- 买家:
,接受 ✓ - 低成本:
(偏离到60:买家可能拒绝)✓ - 高成本:
✓
例子5:声誉模型
设定:
企业类型:
- 诚实型:总是高质量
- 机会型:选择高或低质量
消费者观察历史质量,决定购买
均衡:
早期:机会型模仿诚实型(建立声誉)
后期:机会型提供低质量(收割声誉)
信念:观察到高质量,更新诚实型概率上升
六、相关知识
七、现实应用
市场竞争:
- 进入阻止
- 掠夺性定价
- 产能投资信号
劳动市场:
- 教育信号
- 工作经验
- 试用期
金融市场:
- IPO定价
- 信用评级
- 股利政策
国际关系:
- 军事威慑
- 外交信号
- 谈判策略
法律与监管:
- 诉讼威胁
- 合规信号
- 审计
八、小结
完美贝叶斯均衡是动态不完全信息博弈的核心解概念,要求策略序贯理性和信念一致性。PBE通过贝叶斯法则将观察到的行动与参与者类型联系起来,使参与者能够从对手的行为中学习。PBE是纳什均衡和子博弈完美均衡的推广,广泛应用于信号博弈、声誉模型、讨价还价等领域。理解PBE对于分析信息不对称下的策略互动至关重要。