Skip to content

纳什均衡

一、核心定义

纳什均衡(Nash Equilibrium)是博弈论中的核心概念,指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应,没有参与者有单方面偏离的动机。

形式化定义:

对于 n 人博弈,策略组合 (s1,s2,,sn) 是纳什均衡,当且仅当对所有参与者 i:

ui(si,si)ui(si,si),siSi

其中:

  • ui:参与者 i 的效用函数
  • si:参与者 i 的均衡策略
  • si:其他参与者的均衡策略组合
  • Si:参与者 i 的策略空间

最优反应(Best Response):

参与者 isi 的最优反应:

BRi(si)=argmaxsiSiui(si,si)

纳什均衡是所有参与者最优反应的交点。

二、理论推导 / 核心逻辑

纳什存在性定理:

若博弈满足:

  1. 参与者数量有限
  2. 策略空间是紧凸集
  3. 效用函数连续且拟凹

则至少存在一个混合策略纳什均衡。

求解方法:

  1. 划线法(适用于2×2博弈):

    • 对每个参与者,在每列(行)中标出最优反应
    • 双方都标记的格子是纳什均衡
  2. 最优反应函数法:

    • 导出每个参与者的最优反应函数
    • 求解最优反应函数的交点
  3. 迭代剔除严格劣策略:

    • 反复剔除严格劣策略
    • 若剩下唯一策略组合,则为纳什均衡

纯策略与混合策略:

  • 纯策略纳什均衡:每个参与者选择确定性策略
  • 混合策略纳什均衡:参与者以一定概率随机选择策略

三、关键结论

  1. 纳什均衡是策略的相互最优反应
  2. 纳什均衡可能不唯一
  3. 纳什均衡可能不是帕累托最优(如囚徒困境)
  4. 每个有限博弈至少存在一个混合策略纳什均衡
  5. 严格占优策略均衡一定是纳什均衡
  6. 纳什均衡是自我实施的(Self-Enforcing)

四、图形解释

最优反应函数图:

  • 横轴:参与者1的策略 s1
  • 纵轴:参与者2的策略 s2
  • 曲线:BR1(s2)BR2(s1)
  • 交点:纳什均衡

2×2博弈矩阵:

LR
Ua,bc,d
De,fg,h

用划线法标出最优反应,双重标记的格子是纳什均衡。

五、例子(现实或数值)

例子1:囚徒困境

两个嫌疑人,策略:坦白(C)或抵赖(D)

CD
C-5,-50,-10
D-10,0-1,-1

最优反应分析:

  • 对方C时,自己C(-5) > D(-10)
  • 对方D时,自己C(0) > D(-1)

纳什均衡:(C, C),双方各判5年

帕累托最优:(D, D),双方各判1年

例子2:性别战

夫妻选择活动:足球(F)或芭蕾(B)

FB
F2,10,0
B0,01,2

纯策略纳什均衡:(F,F) 和 (B,B)

混合策略纳什均衡:

  • 男方以 p 概率选F
  • 女方以 q 概率选F

女方无差异条件: 2q=1qq=1/3

男方无差异条件: p=2(1p)p=2/3

混合策略均衡:(p=2/3,q=1/3)

例子3:古诺竞争

两家企业选择产量 q1,q2

市场价格: p=100(q1+q2)

成本: Ci=10qi

利润:

π1=[100(q1+q2)]q110q1

最优反应:

π1q1=1002q1q210=0BR1(q2)=90q22

对称地:

BR2(q1)=90q12

纳什均衡:

q1=90q22,q2=90q12

解得: q1=q2=30

价格: p=10060=40

利润: π1=π2=30×(4010)=900

例子4:现实应用

  • 寡头定价:企业间的价格竞争
  • 军备竞赛:国家间的国防支出
  • 广告竞争:企业的广告投入
  • 拍卖:竞标者的出价策略

六、相关知识

七、现实应用

  1. 寡头竞争:分析企业间的策略互动
  2. 国际关系:贸易谈判、军备控制
  3. 拍卖设计:设计激励相容的拍卖机制
  4. 环境政策:国家间的减排博弈
  5. 网络经济:平台竞争、标准之争

八、小结

纳什均衡是博弈论的核心概念,描述了参与者策略的相互最优反应。纳什均衡可能不唯一,也可能不是帕累托最优。理解纳什均衡对于分析策略互动、设计机制和预测博弈结果至关重要。

经济学知识库