.:. 草榴社區 » 技術討論區 » [冲量科普]  用博弈论撩女人「的确有点意思」[28P]
本頁主題: [冲量科普]  用博弈论撩女人「的确有点意思」[28P]字體大小 寬屏顯示 只看樓主 最新點評 熱門評論 時間順序
冲量


級別:精靈王 ( 12 )
發帖:2916
威望:1389 點
金錢:1 USD
貢獻:4259 點
註冊:2020-03-29

[冲量科普]  用博弈论撩女人「的确有点意思」[28P]


今天介绍一个计算机科学相关的课程——博弈论。
我们来举两个贴近生活的例子。

撩女人困境

假设:

你和你宿舍另外一个男生,同时看上了班上一个妹子。

你俩拼命追求,但因为那妹子太受欢迎,结果水涨船高,人家整天摆足架子,因此你俩都追得很累。

因此,一天晚上,你俩在宿舍开了个会,室友提出一个解决方案:

“你看,我俩一起追,她太傲娇。

不如这样,我们现在约定,本学期都不追,这样她就会感觉自己似乎突然不受欢迎了,就会丧失优越感,我们再追就简单多了,你觉得如何?”(假设就这俩哥们追)

如果你学过博弈论,脑子里一定会浮现出这句话:

你个糟老头子坏得很,我信你个鬼!

你这方案只是帕累托最优,不是纳什均衡,不稳定。

在我们介绍“帕累托最优”和“纳什均衡”这两个概念前,我们先理清思路。

目前一共有四种策略:

a. 都追。
b. 都不追。
c. 他追你不追。
d. 你追他不追。

我们可以列举出这四种策略下,你们各自的收益或损失:

 


帕累托最优,是多个人参与某个资源分配的一种理想状态,这个状态就是:

不可能在不伤害任何一个人利益的同时,使得至少一个人的境遇变得更好。

需要指出的是,帕累托最优只是各种理想态标准中的“最低标准”。也就是说,一种状态如果尚未达到帕累托最优,那么它一定是不理想的,因为还存在改进的余地。

上图中含有三个帕累托最优:

b. 都不追。
c. 他追你不追。
d. 你追他不追。

我们用红色区域标出来了。

为什么它们是帕累托最优呢?

以右下角的策略b为例。

在这个策略中,两人的得分都是3分。而我们发现,不存在任何一个其他策略,可以在不降低任何一个人打分的情况下,增加另一个人的得分。

策略c和d也是一样,因此,他们都是帕累托最优。

而唯一的一个非帕累托最优,即策略a,是一个双输的局面。

可是问题在于,这个看起来最不好的策略a,这个连帕累托最优都不是的策略,却是现实中大家都会采用的策略。

这个策略就被大家称为纳什均衡

纳什均衡的前提,是参与博弈的每个人,都站在自己的角度来看问题,都要最大化自己的收益。

我们按照这个假设再来思考这个问题:

虽然这个家伙今天跟我说了这么一个规则,但人心隔肚皮,我可不能完全信任他。我得考虑在任何情况下如何最大化自己的收益。

因此,你很容易进入这样的思路:

• 如果他不追,那么我应该追。因为我追的话,很容易追上(5分),而如果我不追,我只能得3分。

• 如果他追,那我也应该追,因为这时,我追还有点希望(可能得1分),而不追就彻底出局(0分)。

所以,无论你室友采取哪个策略,你都应该毫不犹豫去追。

这种“不管对手怎么做,某个策略都是最好的”策略,就是压倒性策略

当博弈中出现了压倒性策略,一个理性的决策者都应该毫不犹豫地选择它。

当然,如果你的室友也不笨,他也会选择去追。

这样,你们两个博弈的结果,就到了纳什均衡点上:

你们都去追,你们都只能得1分,落到一个连帕累托最优都不是的结局。

两个聪明的直男博弈,可能落得一个双输的局面。

学生补课

类似的例子还有小朋友的补课问题。

现在别人都补课,都学奥数,你敢不学么?

这种无奈“被参加”各种课外辅导班的现象,也是一个博弈过程。我们也可以按照上面的方法建立一个模型,具体请参考专栏“刘雪峰·信息思维课(第一季)”第81讲,此处从略。

解决方法

在这两个例子中,为什么博弈的结果连帕累托最优都不是呢?

因为在博弈中,帕累托最优是个不稳定的局面

就算一开始博弈双方商量好了,但将来也会有一方出于自身利益的考虑,偷偷改变策略。虽然这个策略会伤害对手利益,但这么做对自己很有利。

这就是人性。

而纳什均衡,是每个人出于自身利益考虑的结果,它是稳定的。

这就好比下图中的小球。

虽然处于高点的小球可以维持平衡,但它是不稳定的,稍微受到扰动,位置就会迅速发生变化。而处于低点的小球位置是稳定的,这就是纳什均衡点。

 


对于中小学补课的现象,有几个方法可以打破这个坏的纳什均衡

第一种方法,就是大家商量好,都不补课。

当然实际中这个很难操作,不可能实现。

所以,作为这个方法的替代品,就是国家从行政上禁止中小学生补课,这就是为什么国家三令五申禁止补课的原因。

这种情况下,相当于博弈双方被强制达成一致意见,因此可以打破原有的坏的纳什均衡点。

但是,行政命令下达之后,也会出现“上有政策,下有对策”的情况,各种课外辅导班改头换面,仍会有相当市场。

行政命令从来不是打破纳什均衡的有效手段,因为这是和人性作斗争。

那么,更好的方法,就是除了高考这一条路外,让每个孩子都有更多接受好的教育的机会和途径。

例如,开设好的民办、私立大学,开设高等技师培训,让之前唯一的高考,变成一个百花齐放的战场。

这样,就完全打破了博弈规则:不补课的那一方,就不会处于完全劣势,这个坏的纳什均衡自

然就被打破了。

现在,这条路也在初显端倪。

感谢互联网时代。

互联网创造了无数机会,不仅让办大学、办教育机构的门槛变低,而且让孩子们的学习途径也变多了,就业市场也变得更多样化。

换句话说,游戏规则正在慢慢改变。


[size=5]敬请欣赏


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 




赞(8)
DMCA / ABUSE REPORT | TOP Posted: 02-09 13:34 發表評論
.:. 草榴社區 » 技術討論區


電腦版 手機版 客戶端 DMCA
用時 0.02(s) x3, 06-17 00:52