Skip to content

完美贝叶斯均衡

一、核心定义

完美贝叶斯均衡(Perfect Bayesian Equilibrium, PBE)是动态不完全信息博弈的解概念,要求参与者的策略在每个信息集上都是最优的,且信念通过贝叶斯法则从策略中推导出来。PBE是纳什均衡和子博弈完美均衡在不完全信息博弈中的扩展。

基本要素:

  1. 策略:s=(s1,...,sn),每个参与者的完整行动计划
  2. 信念:μ,在每个信息集上对节点的概率分布
  3. 信息集:参与者无法区分的决策节点集合

数学表达:

完美贝叶斯均衡 (s,μ) 满足:

  1. 序贯理性(Sequential Rationality):

    siargmaxsiE[ui(si,si)|μ,h]

    对所有信息集 h 和参与者 i

  2. 信念一致性(Belief Consistency): 在均衡路径上,信念由贝叶斯法则确定:

    μ(x|h)=P(x|s)P(h|x,s)xhP(x|s)P(h|x,s)

二、理论推导 / 核心逻辑

与其他均衡概念的关系:

  1. 纳什均衡:策略互为最优反应,但不要求序贯理性
  2. 子博弈完美均衡:完全信息动态博弈,要求每个子博弈都是纳什均衡
  3. 完美贝叶斯均衡:不完全信息动态博弈,要求序贯理性+信念一致性

PBE的求解步骤:

  1. 识别信息集:确定参与者无法区分的节点
  2. 指定策略:每个参与者在每个信息集的行动
  3. 推导信念:使用贝叶斯法则(在均衡路径上)
  4. 检验序贯理性:给定信念,策略是否最优
  5. 检验一致性:信念是否由策略推导

贝叶斯法则应用:

假设信息集 h 包含节点 x1,x2,参与者不知道在哪个节点。

先验概率:P(x1),P(x2)

观察到信号 s 后,后验概率:

μ(x1|s)=P(s|x1)P(x1)P(s|x1)P(x1)+P(s|x2)P(x2)

离均衡路径信念:

在均衡路径外,贝叶斯法则不适用,需要额外限制:

  • 弱完美贝叶斯均衡:任意信念
  • 序贯均衡:信念是完全混合策略的极限
  • 直觉标准:排除不合理信念

三、关键结论

  1. PBE要求策略在每个信息集上都是最优的(序贯理性)
  2. 信念必须与策略一致(通过贝叶斯法则)
  3. PBE是完全信息子博弈完美均衡的推广
  4. PBE可能存在多重均衡
  5. 离均衡路径信念的选择影响均衡结果
  6. 精炼标准(如直觉标准)可减少均衡数量
  7. PBE广泛应用于信号博弈、声誉模型、讨价还价等

四、图形解释

信息集示意图:

        自然(0.5/0.5)
       /              \
    类型1            类型2
      |                |
   发送者            发送者
    /  \              /  \
   L    R            L    R
   |    |            |    |
  接收者 接收者      接收者 接收者
  (信息集:无法区分来自类型1还是类型2)

贝叶斯更新:

  • 先验:P(θ1)=P(θ2)=0.5
  • 观察到信号 m
  • 后验:μ(θ1|m)=P(m|θ1)0.5P(m|θ1)0.5+P(m|θ2)0.5

序贯理性检验:

在每个信息集,给定信念 μ,参与者选择最大化期望效用的行动。

五、例子(现实或数值)

例子1:啤酒-烈酒博弈(Beer-Quiche Game)

设定:

两种类型决斗者:

  • 强硬型(Strong):比例 p=0.1
  • 软弱型(Weak):比例 1p=0.9

早餐选择(信号):

  • 啤酒(Beer)
  • 烈酒(Quiche)

偏好:

  • 强硬型偏好啤酒
  • 软弱型偏好烈酒

挑战者观察早餐,决定是否决斗(Duel)或不决斗(Not)

支付:

  • 决斗者:避免决斗更好(如果软弱),决斗无所谓(如果强硬)
  • 挑战者:只想与软弱型决斗

分离均衡:

策略:

  • 强硬型选择啤酒
  • 软弱型选择烈酒
  • 挑战者:啤酒→不决斗,烈酒→决斗

信念:

  • μ(Strong|Beer)=1
  • μ(Strong|Quiche)=0

序贯理性:

  • 强硬型:选择啤酒(偏好)且避免决斗 ✓
  • 软弱型:选择烈酒(偏好)虽然引发决斗,但如果选啤酒会被认为强硬...

问题:软弱型有激励偏离到啤酒,假装强硬!

混同均衡:

策略:

  • 两种类型都选择啤酒
  • 挑战者:啤酒→不决斗,烈酒→决斗

信念:

  • μ(Strong|Beer)=0.1
  • μ(Strong|Quiche)0.5(离均衡路径)

序贯理性:

  • 挑战者看到啤酒:期望对手强硬概率0.1,不决斗 ✓
  • 软弱型:选啤酒避免决斗,虽然不喜欢啤酒 ✓
  • 强硬型:选啤酒(偏好) ✓

这是PBE!

例子2:市场进入博弈

设定:

在位企业类型:

  • 强势(Strong):成本低,比例 q=0.3
  • 弱势(Weak):成本高,比例 1q=0.7

进入者观察在位企业的产量 Q,决定进入或不进入

支付:

  • 强势企业:高产量成本低
  • 弱势企业:高产量成本高
  • 进入者:只想在对手弱势时进入

分离均衡:

策略:

  • 强势:QH=100
  • 弱势:QL=60
  • 进入者:Q80 不进入,Q<80 进入

信念:

  • μ(Strong|Q=100)=1
  • μ(Strong|Q=60)=0

序贯理性:

  • 强势选择100(利润最大化且阻止进入) ✓
  • 弱势选择60(高产量成本太高) ✓
  • 进入者根据产量推断类型 ✓

例子3:教育信号(简化版)

设定:

工人类型:

  • 高能力:θH,生产率 yH=100,比例 0.6
  • 低能力:θL,生产率 yL=60,比例 0.4

教育成本:

  • 高能力:cH(e)=e
  • 低能力:cL(e)=2e

雇主观察教育 e,提供工资 w(e)

分离均衡:

策略:

  • 高能力:eH=50
  • 低能力:eL=0
  • 雇主:w(50)=100,w(0)=60

信念:

  • μ(θH|e=50)=1
  • μ(θH|e=0)=0

激励相容:

  • 高能力:10050=5060

需要调整!eH=40:

  • 高能力:10040=60=60 (无差异)
  • 低能力:60>10080=20

例子4:讨价还价(不完全信息)

设定:

卖家成本:

  • 低成本:cL=20,比例 p=0.5
  • 高成本:cH=50,比例 1p=0.5

买家估值:v=100

卖家先报价 p,买家接受或拒绝

分离均衡:

策略:

  • 低成本:pL=60
  • 高成本:pH=80
  • 买家:接受 p80

信念:

  • μ(cL|p=60)=1
  • μ(cL|p=80)=0

序贯理性:

  • 低成本:6020=40(不模仿高成本:8020=60)✗

低成本有激励模仿高成本!

混同均衡:

策略:

  • 两种类型都报价 p=75
  • 买家:接受

信念:

  • μ(cL|p=75)=0.5

序贯理性:

  • 买家:v=100>75,接受 ✓
  • 低成本:7520=55(偏离到60:买家可能拒绝)✓
  • 高成本:7550=25

例子5:声誉模型

设定:

企业类型:

  • 诚实型:总是高质量
  • 机会型:选择高或低质量

消费者观察历史质量,决定购买

均衡:

早期:机会型模仿诚实型(建立声誉)

后期:机会型提供低质量(收割声誉)

信念:观察到高质量,更新诚实型概率上升

六、相关知识

七、现实应用

  1. 市场竞争:

    • 进入阻止
    • 掠夺性定价
    • 产能投资信号
  2. 劳动市场:

    • 教育信号
    • 工作经验
    • 试用期
  3. 金融市场:

    • IPO定价
    • 信用评级
    • 股利政策
  4. 国际关系:

    • 军事威慑
    • 外交信号
    • 谈判策略
  5. 法律与监管:

    • 诉讼威胁
    • 合规信号
    • 审计

八、小结

完美贝叶斯均衡是动态不完全信息博弈的核心解概念,要求策略序贯理性和信念一致性。PBE通过贝叶斯法则将观察到的行动与参与者类型联系起来,使参与者能够从对手的行为中学习。PBE是纳什均衡和子博弈完美均衡的推广,广泛应用于信号博弈、声誉模型、讨价还价等领域。理解PBE对于分析信息不对称下的策略互动至关重要。

经济学知识库