第二十一章对策论Slide1纳什均衡纳什均衡:不存在纯战略纳什均衡(-1,1)(1,-1)(1,-1)(-1,1)正面背面正面背面猜硬币第二十一章对策论Slide2纳什均衡混合战略参与者i的一个混合战略是指在其纯战略空间中的一个概率分布。iS——确定选采取某一个纯战略的概率。}{正面,背面iS)1,(ppi混合战略:]1,0[p纯战略空间:第二十一章对策论Slide3纳什均衡纳什均衡:混合战略(-1,1)(1,-1)(1,-1)(-1,1)正面(z)背面(f)正面(z)背面(f)猜硬币参与者i选择正面的概率为P参与者j选择正面的概率为q参与者1参与者2),z()1(),z(),(111fuqpzpquqpu),()1)(1(),()1(11ffuqpzfqup参与者1的期望收益:第二十一章对策论Slide4纳什均衡纳什均衡混合战略)1)(1()1()1(),(1qpqpqppqqpu1422pqqppMax最优反应函数:0]1,0[1)(qp5.0q5.0q5.0q第二十一章对策论Slide5纳什均衡混合战略1/21/2pq)(qp)(pq猜硬币)5.0,5.0(),(**qp第二十一章对策论Slide6纳什均衡练习2:监督博弈:求解纳什均衡努力偷懒监督不监督(0,-h)(W-g,V-W-h)(W-g,V-W)(W,-W)代理人委托人W>g>hW=10,g=5,h=3,v=15第二十一章对策论Slide7完全信息动态博弈例:敲诈博弈博弈分两步:1、参与者1选择支付1000¥给参与者2,好事一分不给。2、参与者2在看到1的选择后,选择是否引爆手雷把两人一块炸死。参与者2的威胁:不给就引爆——是否可信?第二十一章对策论Slide8完全信息动态博弈例:敲诈博弈给不给(R,R)参与者1参与者2(0,1000)(0,1000)(R,L)(L,R)(L,L)),((1000,0)(1000,0)),(),(),(参与者1的战略空间:{给,不给}参与者2的战略空间:{(R,R),(R,L),(L,R),(L,L)}R:不拉;L:拉第二十一章对策论Slide9完全信息动态博弈扩展式博弈博弈树博弈树1、结点:决策结终点结2、枝:可行行动3、信息集第二十一章对策论Slide10完全信息动态博弈敲诈博弈:参与者1给不给参与者2RRLL0100010000敲诈博完美信息:——后动者能够观察到先动者的行为第二十一章对策论Slide11完全信息动态博弈囚徒困境囚徒1沉默坦白囚徒2沉默坦白坦白-1-10-9沉默-90-6-6不完美信息:——不能观察到他人的行为第二十一章对策论Slide12完全信息动态博弈逆向推理ABCDE510728121072251、求最后决策者在给定结点上的最优选择2、给定最后决策者的选择,分析最后第二格决策者的最优选择……最后由初始结点...