天才一秒记住【孤独小说网】地址:https://www.gdntek.com
警察与小偷的博弈
banner"
>
是不是所有博弈都存在一个纯策略(指参与者在其策略空间中选取的唯一确定的策略)的纳什均衡点呢?答案是否定的。
除了上面叙说多次的、大家比较熟悉的纯策略均衡点外,有的博弈并没有一个确定的、唯一的策略,而是存在一个混合策略(指参与者采取的不是确定的唯一的策略,而是在其策略空间中以概率来选择不同策略)均衡点。
下面我们将以警察与小偷的博弈为例,对混合策略均衡点进行说明。
某小镇只有一名巡逻警察,他一个人要负责整个镇的治安。
假定该小镇主要分为A、B两区,A区有一家建设银行,B区有一家金银首饰店。
再假定这个小镇有一个小偷,要对该镇实施偷盗行为。
因为没有分身术,警察一次只能在一个区巡逻;而对于小偷来说,一次也只能去一个地方行窃。
假定A区建设银行需要保护的财产为2万元,B区首饰店的财产价值1万元。
若警察在A区巡逻,而小偷也恰巧选择去了该地,小偷就会被警察当场抓住,该区建设银行的2万元财产就不会损失;若警察在A区巡逻,而小偷却选择去了B区,因没有警察的保护,小偷偷盗成功,B区首饰店的1万元财产将分文不剩,全落进小偷的腰包。
在这种情况下,警察要怎样巡逻才能使效果最好呢?
如果按照先前的思路——只能选取一个确定的唯一的策略,那么明显的做法是:警察在A区巡逻,可以保护该区建设银行的2万元财产不被偷窃。
而小偷去B区,偷窃一定成功,B区首饰店的1万元财产尽归小偷所有。
也就是说警察的收益是2万元,而小偷的收益是1万元。
但是,这种做法是警察的最佳策略吗?存不存在一种更好的策略或者说能不能对这种策略进行改进呢?
若警察在A区或B区巡逻,而小偷也正好选择去A区或B区,则小偷无法实施偷盗,此时警察的收益为3(保住A区建设银行和B区首饰店共3万元财产),小偷的收益为0(没有收益),记作(3,0)。
若警察在A区巡逻,而小偷去B区偷盗,此时,警察的收益为2(保住A区建设银行2万元财产),小偷的收益为1(成功偷盗B区首饰店1万元财产),记作(2,1)。
若警察在B区巡逻,而小偷去A区偷盗,此时,警察的收益为1(保住B区首饰店1万元财产),小偷的收益为2(成功偷盗A区建设银行2万元财产),记作(1,2)。
警察与小偷的收益可写成如下的收益矩阵:
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!