发信人: 2sinxcosx(2sinxcosx)
整理人: 2sinxcosx(2003-10-23 20:59:58), 站内信件
|
纳什均衡与ess是我这两年学到得最喜欢的两个理论,下面关于这两个的解释,发现表述还困难,偏数学形式才能讲明白,得耐心看,还是很有趣的:)
1.纳什均衡
1.1二人零和有限对策之纯策率
纳什均衡是博弈论里的很重要的概念和理论,最简单的一种:二人零和有限对策,零和是指双方利益完全冲突,我的收益就是你的损失,反之亦然;有限对策当然就是指招数有限,设a方有n招,记为a1,a2,…,an ;b方有m招,记为b1,b2,…,bm,两方对局共有n*m个局势,收益形势也就有n*m个,用矩阵s={sij}n*m表示,sij表示a方采用ai b方采用bj时a方的收益,越大越好;-sij是b方的收益,对于b方sij越小越好,如下例:
..........b1....b2....b3
.....a1...-6....1.....-8
.....a2....3....2......4
.....a3....9...-1....-10
.....a4...-3....0.....6
...........a1....a2....a3....a4
......b1....6....-3....-9....3
......b2...-1....-2.....1....0
......b3....8....-4....10....-6
a方如何出招,收益最大的?
a3最大可能收益是9,那就用它行吗?那可是一相情愿,得指望对方是b1,要是b3可惨了;所以对方出什么招是很重要的,简单的方法是最小最大原则,即先考虑自己每一招最坏情况下的收益,然后再从挑出最大的那个,也就是最坏情况下的最大收益,应该是a2,最低期望收益为2,当然这是保守的方法;
对于b方则是最大最小原则,则是b2,最低期望收益为2(以sij作标准,-sij就该是-2)
你会发现两者最低期望收益是相同的,当然了,这是偶构造的特殊形式,对这样的解叫纳什均衡解;
双方愿意接受这样的结局吗?应该,达到了最低期望收益,还都一样,大家也就乐哈哈 :));甘心吗?当然,若b方坚持用b2,你是a方,用用其它招,保管你输,若存在这样的解,对于任何一方主动脱离是会吃亏的。
1.2二人零和有限对策之混合策略
有这样解得情况并不多,如下的对策收益阵:
..........b1...b2
......a1...3....6
......a2...5....4
a方应该用a2,最低期望收益为4,也就是碰到b2;b方应该用b1最低期望收益为5,也就是碰到a2。若是这样a方的实际收益是5,比期望的多了1,很开心啊;b方虽是期望,终究不大平衡,想想既然a方用a2,何不用b2?倘若a方也想到这一层,问题就不好办了,没有一个认可的解,大家就开始斗心思。
若是可以出混合策略如何?鸡蛋不能放在一个篮子里,小孩都知道的,对于a方a1占x1、a2占x2,对于b方b1占y1、b2占y2, x1、x2、y1、y2多少合适呢?
a方的收益计算公式:x1*(3*y1+6*y2)+x2*(5*y1+4*y2)
b方的收益计算公式:y1*(3*x1+5*x2)+y2*(6*x1+4*x2)
两个式子一样,但对a方可是越大越好,b方越小越好
可解得x1=1/4,x2=3/4 y1=1/2,y2=1/2 ,收益是9/2 ,怎么解的就不讲了,敲起来费劲,可以试试当一方采用此组合,另一方不用,看看结果如何?
这就是纳什均衡,“美丽心灵”中有这一段,是纳什在舞厅里约姑娘失利后的痛苦思索得经验,我还没想明白是怎么回事
2.进化稳定对策(ess)
ess(evolutionary stable strategy),进化稳定对策,当种群内所有个体都采取了某个对策后,其它对策者都不能侵入该种群,那么这个对策就是进化上稳定得。经典例子是鹰鸽对策,群体里当老鹰的多还是鸽子的多,比例是多少?
考虑极端情况:
若都是老鹰如何?雄赳赳,气昂昂,很威风,但却会为了利益互不相让,退让了就是鸽子,胜固然好,败了就要损失;因为偶尔原因混进一些鸽子,鸽子遇到老鹰就溜了,不吃亏,若遇到的还是鸽子,其中一方会妥协,平均上获利应是一半,这样这些鸽子不会消失,还会增多
若都是鸽子又如何?这时某个原因诞生了只老鹰,那就是要风得风,要雨有雨,老鹰就会越来越多,从上面知道,也不会都成为老鹰。
这样可以知道,在这个群体里,必定是老鹰与鸽子的混合,单一是不稳定得,老鹰与鸽子比例是由对阵的收益确定的,若对阵胜方得v,败方损失c;鹰鹰对阵,必分胜负,期望收益(v-c)/2(胜败机会相等);鹰鸽对阵,鹰为v,鸽为0;鸽鸽对阵,一方退让,期望收益为v/2,赢得阵为:
....................鹰..........鸽
..............鹰..(v-c)/2.......v
..............鸽.....0.........v/2
这就变成寻找纳什均衡的形式了,需要注意的这不是二人零和有限对策:首先不是双方,而是一个群体中的两类,鹰、鸽;若认为是双方对阵,鹰鸽是策略,也不是零合的。但思想是相通得。
设鹰的比例是x ,鸽的比例就是1-x,当鹰和鸽的好处分别是:
鹰:x *(v-c)/2 +(1-x)v
鸽:(1-x)*v/2
两者相等才不发生转化,也即:
x *(v-c)/2 +(1-x)v=(1-x)*v/2
解得 x=v/c
也就是是说如果cv,则老鹰的比例是v/c,再多了,天天打架还不如做鸽子
附:
纳什均衡最早是从一本“运筹学”博弈论里看到得,当时只知是“二人零和有限对策”,很喜欢这个结果,后来在书店里蹭书看到一本关于麻省的幽灵的书(很可惜没记住名字,想买时怎么找也没找到,只知是一本传记),有两点给我的印象很深,一是他的臆想症,同一个我知道的人讲述的情形想近,真佩服“美丽心灵”的导演,清晰表现出这一点;另一是“二人零和有限对策”属于纳什均衡,并在几年前因此获得nobel,很是惊奇;
在经济学获得很广应用,可惜我不能做到不费劲就看懂,花时间投入也不合算;个人感觉纳什均衡带来的是观念的变革(对于西方思想),至少我现在不再把考虑最大效益作为最优,那只是一厢情愿,实现不了的
ess 在北大尚玉昌出得那本“普通(行为?)生态学”和张大勇的“理论生态学研究”都讲到,我主要看的是前者,更专业得我还没找,那位能提供?
---- How can I know that you and I perceive the same thing when we both see the color red? |
|