纳什均衡
一、核心定义
纳什均衡(Nash Equilibrium)是博弈论中的核心概念,指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应,没有参与者有单方面偏离的动机。
形式化定义:
对于
其中:
:参与者 的效用函数 :参与者 的均衡策略 :其他参与者的均衡策略组合 :参与者 的策略空间
最优反应(Best Response):
参与者
纳什均衡是所有参与者最优反应的交点。
二、理论推导 / 核心逻辑
纳什存在性定理:
若博弈满足:
- 参与者数量有限
- 策略空间是紧凸集
- 效用函数连续且拟凹
则至少存在一个混合策略纳什均衡。
求解方法:
划线法(适用于2×2博弈):
- 对每个参与者,在每列(行)中标出最优反应
- 双方都标记的格子是纳什均衡
最优反应函数法:
- 导出每个参与者的最优反应函数
- 求解最优反应函数的交点
迭代剔除严格劣策略:
- 反复剔除严格劣策略
- 若剩下唯一策略组合,则为纳什均衡
纯策略与混合策略:
- 纯策略纳什均衡:每个参与者选择确定性策略
- 混合策略纳什均衡:参与者以一定概率随机选择策略
三、关键结论
- 纳什均衡是策略的相互最优反应
- 纳什均衡可能不唯一
- 纳什均衡可能不是帕累托最优(如囚徒困境)
- 每个有限博弈至少存在一个混合策略纳什均衡
- 严格占优策略均衡一定是纳什均衡
- 纳什均衡是自我实施的(Self-Enforcing)
四、图形解释
最优反应函数图:
- 横轴:参与者1的策略
- 纵轴:参与者2的策略
- 曲线:
和 - 交点:纳什均衡
2×2博弈矩阵:
用划线法标出最优反应,双重标记的格子是纳什均衡。
五、例子(现实或数值)
例子1:囚徒困境
两个嫌疑人,策略:坦白(C)或抵赖(D)
| C | D | |
|---|---|---|
| C | -5,-5 | 0,-10 |
| D | -10,0 | -1,-1 |
最优反应分析:
- 对方C时,自己C(-5) > D(-10)
- 对方D时,自己C(0) > D(-1)
纳什均衡:(C, C),双方各判5年
帕累托最优:(D, D),双方各判1年
例子2:性别战
夫妻选择活动:足球(F)或芭蕾(B)
| F | B | |
|---|---|---|
| F | 2,1 | 0,0 |
| B | 0,0 | 1,2 |
纯策略纳什均衡:(F,F) 和 (B,B)
混合策略纳什均衡:
- 男方以
概率选F - 女方以
概率选F
女方无差异条件:
男方无差异条件:
混合策略均衡:
例子3:古诺竞争
两家企业选择产量
市场价格:
成本:
利润:
最优反应:
对称地:
纳什均衡:
解得:
价格:
利润:
例子4:现实应用
- 寡头定价:企业间的价格竞争
- 军备竞赛:国家间的国防支出
- 广告竞争:企业的广告投入
- 拍卖:竞标者的出价策略
六、相关知识
七、现实应用
- 寡头竞争:分析企业间的策略互动
- 国际关系:贸易谈判、军备控制
- 拍卖设计:设计激励相容的拍卖机制
- 环境政策:国家间的减排博弈
- 网络经济:平台竞争、标准之争
八、小结
纳什均衡是博弈论的核心概念,描述了参与者策略的相互最优反应。纳什均衡可能不唯一,也可能不是帕累托最优。理解纳什均衡对于分析策略互动、设计机制和预测博弈结果至关重要。