完美贝叶斯均衡

一、核心定义

完美贝叶斯均衡(Perfect Bayesian Equilibrium, PBE)是动态不完全信息博弈的解概念,要求参与者的策略在每个信息集上都是最优的,且信念通过贝叶斯法则从策略中推导出来。PBE是纳什均衡和子博弈完美均衡在不完全信息博弈中的扩展。

基本要素:

策略: $s = (s_{1}, . . ., s_{n})$ ,每个参与者的完整行动计划
信念: $μ$ ,在每个信息集上对节点的概率分布
信息集:参与者无法区分的决策节点集合

数学表达:

完美贝叶斯均衡 $(s^{*}, μ^{*})$ 满足:

序贯理性(Sequential Rationality):
$s_{i}^{*} \in \arg max_{s_{i}} E [u_{i} (s_{i}, s_{- i}^{*}) | μ^{*}, h]$
对所有信息集 $h$ 和参与者 $i$
信念一致性(Belief Consistency): 在均衡路径上,信念由贝叶斯法则确定:
$μ^{*} (x | h) = \frac{P (x | s^{*}) \cdot P (h | x, s^{*})}{\sum_{x^{'} \in h} P (x^{'} | s^{*}) \cdot P (h | x^{'}, s^{*})}$

二、理论推导 / 核心逻辑

与其他均衡概念的关系:

纳什均衡:策略互为最优反应,但不要求序贯理性
子博弈完美均衡:完全信息动态博弈,要求每个子博弈都是纳什均衡
完美贝叶斯均衡:不完全信息动态博弈,要求序贯理性+信念一致性

PBE的求解步骤:

识别信息集:确定参与者无法区分的节点
指定策略:每个参与者在每个信息集的行动
推导信念:使用贝叶斯法则(在均衡路径上)
检验序贯理性:给定信念,策略是否最优
检验一致性:信念是否由策略推导

贝叶斯法则应用:

假设信息集 $h$ 包含节点 $x_{1}, x_{2}$ ,参与者不知道在哪个节点。

先验概率: $P (x_{1}), P (x_{2})$

观察到信号 $s$ 后,后验概率:

μ (x_{1} | s) = \frac{P (s | x_{1}) \cdot P (x_{1})}{P (s | x_{1}) \cdot P (x_{1}) + P (s | x_{2}) \cdot P (x_{2})}

离均衡路径信念:

在均衡路径外,贝叶斯法则不适用,需要额外限制:

弱完美贝叶斯均衡:任意信念
序贯均衡:信念是完全混合策略的极限
直觉标准:排除不合理信念

三、关键结论

PBE要求策略在每个信息集上都是最优的(序贯理性)
信念必须与策略一致(通过贝叶斯法则)
PBE是完全信息子博弈完美均衡的推广
PBE可能存在多重均衡
离均衡路径信念的选择影响均衡结果
精炼标准(如直觉标准)可减少均衡数量
PBE广泛应用于信号博弈、声誉模型、讨价还价等

四、图形解释

信息集示意图:

        自然(0.5/0.5)
       /              \
    类型1            类型2
      |                |
   发送者            发送者
    /  \              /  \
   L    R            L    R
   |    |            |    |
  接收者 接收者      接收者 接收者
  (信息集:无法区分来自类型1还是类型2)

贝叶斯更新:

先验: $P (θ_{1}) = P (θ_{2}) = 0.5$
观察到信号 $m$
后验: $μ (θ_{1} | m) = \frac{P (m | θ_{1}) \cdot 0.5}{P (m | θ_{1}) \cdot 0.5 + P (m | θ_{2}) \cdot 0.5}$

序贯理性检验:

在每个信息集,给定信念 $μ$ ,参与者选择最大化期望效用的行动。

五、例子(现实或数值)

例子1:啤酒-烈酒博弈(Beer-Quiche Game)

设定:

两种类型决斗者:

强硬型(Strong):比例 $p = 0.1$
软弱型(Weak):比例 $1 - p = 0.9$

早餐选择(信号):

啤酒(Beer)
烈酒(Quiche)

偏好:

强硬型偏好啤酒
软弱型偏好烈酒

挑战者观察早餐,决定是否决斗(Duel)或不决斗(Not)

支付:

决斗者:避免决斗更好(如果软弱),决斗无所谓(如果强硬)
挑战者:只想与软弱型决斗

分离均衡:

策略:

强硬型选择啤酒
软弱型选择烈酒
挑战者:啤酒→不决斗,烈酒→决斗

信念:

$μ (Strong | Beer) = 1$
$μ (Strong | Quiche) = 0$

序贯理性:

强硬型:选择啤酒(偏好)且避免决斗 ✓
软弱型:选择烈酒(偏好)虽然引发决斗,但如果选啤酒会被认为强硬...

问题:软弱型有激励偏离到啤酒,假装强硬!

混同均衡:

策略:

两种类型都选择啤酒
挑战者:啤酒→不决斗,烈酒→决斗

信念:

$μ (Strong | Beer) = 0.1$
$μ (Strong | Quiche) \geq 0.5$ (离均衡路径)

序贯理性:

挑战者看到啤酒:期望对手强硬概率0.1,不决斗 ✓
软弱型:选啤酒避免决斗,虽然不喜欢啤酒 ✓
强硬型:选啤酒(偏好) ✓

这是PBE!

例子2:市场进入博弈

设定:

在位企业类型:

强势(Strong):成本低,比例 $q = 0.3$
弱势(Weak):成本高,比例 $1 - q = 0.7$

进入者观察在位企业的产量 $Q$ ,决定进入或不进入

支付:

强势企业:高产量成本低
弱势企业:高产量成本高
进入者:只想在对手弱势时进入

分离均衡:

策略:

强势: $Q_{H} = 100$
弱势: $Q_{L} = 60$
进入者: $Q \geq 80 \Rightarrow$ 不进入, $Q < 80 \Rightarrow$ 进入

信念:

$μ (Strong | Q = 100) = 1$
$μ (Strong | Q = 60) = 0$

序贯理性:

强势选择100(利润最大化且阻止进入) ✓
弱势选择60(高产量成本太高) ✓
进入者根据产量推断类型 ✓

例子3:教育信号(简化版)

设定:

工人类型:

高能力: $θ_{H}$ ,生产率 $y_{H} = 100$ ,比例 $0.6$
低能力: $θ_{L}$ ,生产率 $y_{L} = 60$ ,比例 $0.4$

教育成本:

高能力: $c_{H} (e) = e$
低能力: $c_{L} (e) = 2 e$

雇主观察教育 $e$ ,提供工资 $w (e)$

分离均衡:

策略:

高能力: $e_{H} = 50$
低能力: $e_{L} = 0$
雇主: $w (50) = 100$ , $w (0) = 60$

信念:

$μ (θ_{H} | e = 50) = 1$
$μ (θ_{H} | e = 0) = 0$

激励相容:

高能力: $100 - 50 = 50 \geq 60$ ✗

需要调整! $e_{H} = 40$ :

高能力: $100 - 40 = 60 = 60$ (无差异)
低能力: $60 > 100 - 80 = 20$ ✓

例子4:讨价还价(不完全信息)

设定:

卖家成本:

低成本: $c_{L} = 20$ ,比例 $p = 0.5$
高成本: $c_{H} = 50$ ,比例 $1 - p = 0.5$

买家估值: $v = 100$

卖家先报价 $p$ ,买家接受或拒绝

分离均衡:

策略:

低成本: $p_{L} = 60$
高成本: $p_{H} = 80$
买家:接受 $p \leq 80$

信念:

$μ (c_{L} | p = 60) = 1$
$μ (c_{L} | p = 80) = 0$

序贯理性:

低成本: $60 - 20 = 40$ (不模仿高成本: $80 - 20 = 60$ )✗

低成本有激励模仿高成本!

混同均衡:

策略:

两种类型都报价 $p = 75$
买家:接受

信念:

$μ (c_{L} | p = 75) = 0.5$

序贯理性:

买家: $v = 100 > 75$ ,接受 ✓
低成本: $75 - 20 = 55$ (偏离到60:买家可能拒绝)✓
高成本: $75 - 50 = 25$ ✓

例子5:声誉模型

设定:

企业类型:

诚实型:总是高质量
机会型:选择高或低质量

消费者观察历史质量,决定购买

均衡:

早期:机会型模仿诚实型(建立声誉)

后期:机会型提供低质量(收割声誉)

信念:观察到高质量,更新诚实型概率上升

六、相关知识

七、现实应用

市场竞争:
- 进入阻止
- 掠夺性定价
- 产能投资信号
劳动市场:
- 教育信号
- 工作经验
- 试用期
金融市场:
- IPO定价
- 信用评级
- 股利政策
国际关系:
- 军事威慑
- 外交信号
- 谈判策略
法律与监管:
- 诉讼威胁
- 合规信号
- 审计

八、小结

完美贝叶斯均衡是动态不完全信息博弈的核心解概念,要求策略序贯理性和信念一致性。PBE通过贝叶斯法则将观察到的行动与参与者类型联系起来,使参与者能够从对手的行为中学习。PBE是纳什均衡和子博弈完美均衡的推广,广泛应用于信号博弈、声誉模型、讨价还价等领域。理解PBE对于分析信息不对称下的策略互动至关重要。

完美贝叶斯均衡 ​

一、核心定义 ​

二、理论推导 / 核心逻辑 ​

三、关键结论 ​

四、图形解释 ​

五、例子(现实或数值) ​

六、相关知识 ​

七、现实应用 ​

八、小结 ​

完美贝叶斯均衡

一、核心定义

二、理论推导 / 核心逻辑

三、关键结论

四、图形解释

五、例子(现实或数值)

六、相关知识

七、现实应用

八、小结