有一些关于“聚焦于收益的批评”的有趣研究。例如,人们认识到,即使大家对自己的收益感兴趣,但也不仅仅是简单地最大化自身的收益,还包括减轻他们最终可能感到的后悔(Savage,1951)。这种特定的行为方式,即“后悔最小化”行为在哈尔彭和帕斯(Halpern and Pass,2012)的论文中被简洁地形式化了。其中的想法如下:首先考虑一个参与者的选择,例如你选2;然后再考虑对方的选择。此时你选2后感到的最大后悔值,就是你选2失去的相对收益。即如果对方选90,你将得到4;但如果你选89,你可以得到91。所以对于你选2而言,在对方选90的情况下,你的后悔值为91-4 = 87。当然,如果对方也选2,你的后悔值就是0,因为你不能通过偏离2获得更好的收益。但如果对方选100,很容易看出,你的后悔值将是97,以此类推。
有趣的是,在旅行者困境博弈中,所有参与者的“后悔最小化”行为会产生一个清晰的结果,即每个参与者都会从96、97、98、99、100中任选一个数。因此,如果参与者都是“后悔最小化”者,那么博弈的均衡结果就是在集合{96,97,98,99,100}中的一对选择。此一结果令人更感兴趣的是,在贝克尔、卡特和内韦(Becker、Carter and Naeve,2005)的文章中,当博弈论学会的会员在被问到他们将会如何参与旅行者困境博弈时,最常见的答案是2、96、97、98、99和100。如果我们忽略2,认为2是那些为了证明自己是博弈论专家、能够发现纳什均衡的会员给出的答案,那么“后悔最小化”行为的结果与这一经验研究发现的巧合是值得注意的。
例如,参见Goeree and Holt(2001),Gintis(2009),Velu、Iyer and Gair(2010),Arad and Rubinstein(2012),Manapat、Rand、Pawlowitsch and Nowak(2012),Capraro(2013),Morone、Morone and Germani(2014),以及Bavly(2017)。
参见Capra、Goeree、Gomez and Holt(1999),Becker、Carter and Naeve(2005),以及Rubinstein(2006)。在类似实验的设计中,收益额在180 ~300美元,惩罚和奖励则各为5美元。Rubinstein在Ben-Gurion、Tel Aviv、Technion、Tilburg、LSE、British Columbia、York(Canada)、Georgetown and Sabanci等大学举办讲座时,也向听众提出了这个问题。人们选择的平均数额略低于280美元,其中LSE(伦敦经济学院)最高(281美元)、Sabanci最少(263美元)。有少数人做出了180美元的纳什均衡选择,Rubinstein(2006,第875页)将他们称为“博弈论的受害者”。
此外,一些行为经济学和心理学的最新研究表明,人们还有其他方式处理后悔问题。其中之一是“故意的无知”,即不愿意去知道。Gigerenzer and Garcia-Retamero(2017)的研究表明,面对未来的负面事件,85%~90%的人更倾向于“故意的无知”,他们将此解释为一种处理后悔的方式。
参见Pace(2009),Manapat、Rand、Pawlowitsch and Nowak(2012)。
已有文献中与此最为接近的研究,是Arad and Rubinstein(2017)近期的论文。他们从经验观察出发,发现当个人必须从一组庞大而复杂的策略中做出选择时,并不会仔细考虑整个策略集,而是先以某种有意义的方式区分策略集,然而再考查所有这些被区分的策略集中的选项。让我跳过具体的细节,结果是这一分析导致了一种集值均衡,即MD均衡。在旅行者困境博弈中,参与者先在选择个位数、两位数和三位数的三种策略中加以考虑,对应的集合分别是S = {2,3,. . . ,9},D = {10,11,. . . ,99}和T = {100}。可以看出,该博弈有两个MD均衡,即S和D。换句话说,两位参与者从集合{10,11,. . . ,99}中选择任一数字,即构成一个均衡。这里的一个问题是,如果允许参与者再进行第二轮思考,即他们选择了MD均衡后,如果试图剖析从MD均衡集中所选的特定策略,那么在一定的推理下,又会得出一个最低的整数值。这表明,继续推进分析的方法是把Arad and Rubinstein提出的类似思路与“定义不明确的集合”特性相结合。这样,我们可以决定选择一个“相当大的数字”。因为对什么是“相当大的”并没有共同的精确理解,所以在这个集合中进行逆向归纳时,无法得出一个最大值。然而,如何形式化上述想法,仍是一个有待解决的问题。