五分钟经济学|人人都有“神经病”：从多巴胺到非理性决策-来谈经济-财新网

提要

虽然我们总是追求理性，但时常却会做出“非理性”决策。一个核心的原因就是我们选择了不靠谱的参考点。厉害的人之所以厉害，就是能够随着环境变化，选择合适的参考点。

经济学的知行合一，要求我们作为决策者，必须先做对的事情，然后才是把事情做对。

给定时间精力有限，这就要求我们把主要精力放在那些大的、重要的上面，而不应该在小的、次要的事情上纠缠很多，即通常所谓的抓大放小。

这也就是《矛盾论》中阐释的观点，我们应该将主要精力放在主要矛盾上，而不是次要矛盾上。

但现实生活中，我们通常却不是如此理性的。英文有个谚语“penny wise，pound foolish”，翻译成汉语可以是“小聪明，大糊涂”，意思是说很多人在“一便士”之类的小事上斤斤计较，显得非常聪明，但在“一英镑”级别的大事上却时常粗心大意，以至于有些愚蠢。

比如说，很多人日常买菜的时候，讨价还价非常耗时卖力，但买股票却非常冲动，随便听到一个“内幕消息”，不去收集资料核实是否靠谱，或者思考一下为何“内幕消息”能够到他这里，就重仓杀入，结果往往是亏多赢少。

这种决策选择显然是“非理性”的：给定时间有限，把更多的时间投入到研究和核实“内幕消息”的真假上，而不是花在鸡毛蒜皮的讨价还价上；因为每天的买菜钱，与重仓股票价格些许波动所牵涉到的资金波动相比，真可谓小巫见大巫了。

作为决策者，我们当然希望避免诸如此类的非理性行为。但之所以不能做到“抓大放小”，显然不是我们不希望“抓大放小”，而是在具体的决策环境中，我们往往难以做大小之辩或者忘记了主次之分。

所谓存在的就是合理的，这种非理性行为之所以能够长期存在，必然是因为背后有某种更加深刻的机制在起作用。

大小之辩、主次之分所牵涉到一个核心问题，即我们的“报酬系统”（reward system）是如何构建的？时间如流水，我们每个人都是从过去走来，活在当下，却又不可逆转地走向未来。

所以普遍的看法是，我们在过去的所经所历，以及我们对未来的期许盼望，是这些“快乐”或者“痛苦”，决定了我们对事物相对重要性的判断。这种阐释，听起来非常符合常识，也富有哲学意味，但实际上却与神经科学以及行为经济学的研究并不一致。

因为神经科学和行为经济学的最新研究表明，我们的大脑所设定的“报酬体系”不是与“快乐”或“痛苦”本身相关，而是与“快乐”或者“痛苦”的变化有关。

从神经科学的角度看，我们的决策是这样一个信息的收集和处理过程：首先，我们的感官系统是一系列功能不同的传感器（眼耳鼻舌身意），它们将感知到的外界信息（色声香味触法），转化成生物电信号，通过神经系统传导到大脑，而大脑再根据其所预先设定的“模糊算法”对这些信号进行处理，判断轻重缓急，权衡利弊得失，最终做出相应的“最优选择”。

如此看来，我们时常显得非理性，乃是因为我们大脑决策体系所认为的“最优选择”，并非真正符合我们自身利益最大化的最优选择。也就是说，我们大脑所设定的“报酬体系”对事物重要性的评价与我们置身其中的环境或社会对事物重要性的评价并不一致。

理解个中原由，要从神经元（neurons）说起。神经元是大脑负责信息处理的细胞，而我们的大脑，大概包括1000亿个直接或间接彼此联通的神经元。每个神经元从其他神经元获取信号、集成信号，然后再向大脑的其他部分传递新的信号。这是一个非常复杂的过程，详细的描述超出了本人的知识领域，感兴趣的读者可以参考相关的专业书籍。

在这1000多亿的神经元中，实际上只有100多万个位于“中脑腹侧被盖区”（ventral tegmental area, VTA）的神经元，才是对我们决策能力有决定性影响的。这些神经元内部，信号以生物电流的方式，沿着神经元的膜壁（membrane wall）流动。一个神经元给其他神经元发送信号时，这些信号会从居于神经元中心的细胞体传输到神经轴突（axon）。

这种信号传输速度有快有慢。有时候，神经元一秒钟只发几个信号，而另外一些时候，它们却会变得非常活跃，一秒钟能迸发出很多信号。神经科学家将此称为神经元的放电率（firing rate）。

在神经科学研究中，人们正是通过将非常细微电线插入到大脑贴近这些神经元的地方，来记录这些电流信号并将其输入到电脑里面的。

这里需要特别强调多巴胺神经元。这是一种通过化学物质多巴胺而与其他神经元而让进行信息交流的特殊神经元。每次电流信号沿着神经元流动，将会在神经元之间的叫作突触（synapse）的裂口处终结，然后激发释放化学物质多巴胺。这些多巴胺会被相邻的神经元所吸收，并提高这些神经元的活跃程度。

长期以来，人们已经知道多巴胺神经元对于运动和行为的关键作用。脑干多巴胺神经元的退化，被认定为“帕金森综合征”的标志性特征。众所周知，帕金森患者手脚会不由自主地抖动，身体会变得僵硬，也会产生无法控制的剧烈震颤。

现在，神经科学家进一步知道，多巴胺神经元还有一个重要功能，即影响大脑的价值判断，而多巴胺神经元损伤，会导致所谓的报酬预测错误（reward prediction error）。

1990年代，神经科学家沃尔夫兰·舒尔茨（Wolfram Schultz）做过一个著名的研究。如前述方法，他将非常细微的电线植入猴子的“中脑腹侧被盖区”（VTA）；这样，在猴子得到诸如果汁之类的奖励时，他就可以记录下猴子VTA神经元的信号。

舒尔茨发现，同一个多巴胺神经元，当猴子得到果汁或者收到将有果汁的警示信号时，其放电率会增加，而当猴子没有得到预期的果汁时，其放电率则会下降。

这个实验意义非常重要，它校正了人们对多巴胺的常规认识。多巴胺经常被称为大脑的“欢愉化学物质”，意指多巴胺是对欢愉或者痛苦做出反应，但这个实验却表明，多巴胺神经元不是对报酬（欢愉或痛苦）本身做出反应，而是对“超预期”，即期望与现实的差异做出反应。

这就是现在人们已经熟知的“报酬预测误差”。很有趣的是，资本市场也呈现出这种特性：投资者们往往关注的不是投资标的基本面，而是基本面的“超预期”变化。

接下来的问题是，到底如何才叫作超预期呢？这显然牵涉到两个关键因素：

第一，必须有一个比较基准，即参考点。没有参考点，就无所谓差异；没有预期，就无所谓超预期。我们说珠穆朗玛峰高度为8844米，那是因为我们取海平面参考点，但若以珠峰大本营为准，珠峰的相对高度就小了很多。

第二，神经元对差异感知的敏感度。任何传感器都有其精度，精度小智能感知比较粗略的变化，而精度高的则可以感知更加细微的变化。但无论如何，对任何传感器，只有当变化达到或超过其感知精度之后，这种变化才能被察觉。

将青蛙扔到热水里，它一下就蹦出来了，因为温度变化如此之大，使得青蛙能够获得极其强烈的感知；但温水煮青蛙，则任何时点，水温变化的幅度都小于青蛙的感知精度，乃至于最后青蛙被活活煮死。

将参考点和感知精度联系起来的是韦伯定律（Weber’s law）：区分两种刺激（stimuli）所需的差异，是它们量度的恒常比例。

这个定律取名于恩斯特·韦伯（Ernst Weber），心理学一个重要奠基人。十九世纪中叶，韦伯做了他平生最为著名但也极其简单的科学实验。

他将人们带到实验室，要求他们举起一个物体，之后再举起另一个物体，然后再让他猜测两个物体重量是否存在差异。

他发现，只有当两个物体重量之差超过它们重量的一个恒常比例之后，人们才能准确感知两者存在重量差异。

举例来说，虽然人们肯定能区分2斤1两，但他们却无法区分20斤与20斤1两，尽管两者差异都是1两。相对于20斤这个参考点，人们可感知差异大概需要6两左右。

一般地，只有当两者重量差异相当至少2到3个百分点时，人们才能准确感知到这种差异。

根据韦伯定理，人们的决策精度就与“标度”（range）密切相关，这也因此称为“标度效应”。

当我们关注小问题时，它所牵涉到价值标度很小，而按比例计算，这时候我们所做决策的精度也就非常高；

但当我们关注大问题时，它所牵涉到的价值标度很大，而按比例计算，这时候我们所做决策的精度，从绝对量角度来看，就会显然非常粗糙。

这种由“标度效应”导致的非理性行为普遍存在，本文开头提到买菜和买股票，就是非常贴近现实也屡见不鲜的实例。而标度效应之所以如此普遍，则是因为它与我们大脑感知世界和处理信息的方式有关。

从前面的介绍可知，神经元是大脑进行信息处理的基本单元。神经元之间通过电流信号相互沟通，而绝大多数神经元都只具有非常有限的放电率范围。比如说，缓慢放电大概是每秒一次左右，而快速放电大概是每秒一百次左右，则从慢到快相差一百倍。

但是，我们生活其中的世界是五彩斑斓、变化莫测的，其中牵涉到的感官跨度极其巨大。从星光暗淡的深夜到艳阳高照的白昼，亮度变化的倍数以百万计；同样，蚊蝇的翅膀扇动到霹雳的天崩地裂，声音变化的倍数也数以百万计。

这就意味着，我们的大脑时而要处理非常细微的数量，时而要处理非常巨大的数量，时而还要适应从细微数量到巨大数量的突然变化。

由此产生的核心问题是，我们的大脑如何才能用放电率范围非常有限的神经元，来应对数量变化近乎无穷的外部世界的呢？

显而易见的挑战是，从星夜到白昼，光亮增强了百万倍，而我们神经元的放电率却没办法相应地增加百万倍。

反过来也是一样，从白昼到星夜，光亮减弱了百万倍，而我们的神经元的放电率却没办法相应地降低百万倍。

对于上述挑战，我们大脑给出的解决方案是：既然神经元的放电率不能做到同步变化，那就改变参考点。

通过改变参考点来解决问题，实际上就是一个重新对标的过程。可以这样来理解：

假设神经元的放电率范围是每秒1-100，星夜的亮度范围是0-1，而白昼的亮度范围是0-10000000。那么，身处星夜，大脑会将亮度0.5选为参考点，并对应于每秒50次的放电率；而身处白昼，大脑会将亮度5000000选为参考点，也对应于每秒50次的放电率。如此变换之后，神经元就又可以在新的环境下按比例感知数量变化了。

正是通过改变参考点和调整标度，我们的大脑做到了以有限应对无限；这种适应外部世界的解决方案，是生物进化和自然选择的结果，非常不可思议。

但这种变化不是没有代价，以有限应对无限，本质上是以精度换尺度。要么是赢得了尺度，损失了精度；要么是赢得了精度，损失了格局。

从小尺度变到大尺度，虽然我们感知差异的相对比例保持不变，但从绝对量的角度看，决策精度却是大大下降了。10块钱，对于日常买菜来说已经是非常显著的差异了，但对于买股票却几乎察觉不到。

由此导致的一个决策风险是，一个平素生活在小尺度的人（比如月入1万的工薪阶层），一旦进入赌场，因为赌注参考点变高，他就很有可能会显得异常大方，全然忘记了，这里筹码波动完全超出了自己实际的承受能力。

从大尺度变到小尺度，以参考点按比例感知差异，从绝对量角度看，绝对精度是大大提高了。但这时候，如果全然忘记大尺度的存在，人们就有可能会只见树木而不见森林，深陷琐碎事务而忘记大势格局。

东坡是有禅意的人，一句“不识庐山真面目，只缘身在此山中”，便道尽了个中究竟。

虽然我们总是追求理性，但时常却会做出“非理性”决策。一个核心的原因就是我们选择了不靠谱的参考点。

厉害的人之所以厉害，就是能够随着环境变化，选择合适的参考点。

如上所述，参考点的选择，本质上牵涉到决策精度和决策格局之间的权衡。

做对的事情，代表的是决策格局，是战略，是方向，是领导力，要求我们选择大尺度参考点；

把事情做对，代表的决策精度，是管理，是战术，是执行力，要求我们选择小尺度参考点。

是故，毛泽东讲“战略上藐视敌人，战术上重视敌人”。

是故，韩信忍受胯下之辱，是因为他胸怀大志，懂得小不忍则乱大谋。

古人云，“夫志当存高远”，核心就在于塑造“君子”的大格局；有了这个大格局，才可以不随波逐流，做到“一箪食，一瓢饮，在陋巷，人不堪其忧，回也不改其乐。”

但凡事有辩证，光有大尺度参考点，而没有小尺度参考点，则不免会陷入好高骛远、志大才疏的尴尬境地。

经常听到这样的辩题。有人说，一屋不扫，何以扫天下？也有人说，扫天下者，何须扫一屋？

从参考点角度来看，偏执于任何一种观点，皆不可取。因为最佳的行为方式或许是，有扫天下之志能者，虽扫一屋，亦不可暴殄天物，忘却扫天下之志能也。

反过来看，以扫天下之志能而扫一屋，可谓小试牛刀，实有以小见大之功。古人云，治大国如烹小鲜，此之谓也。

从前面的介绍可知，尽管我们大脑所包含的神经元数以亿计，但毕竟还是数量有限；这就决定了，我们大脑的计算功能或者认知能力也必定有限。简言之，我们在决策时面临着大脑信息处理的能力约束。

与此同时，我们用以决策的时间并非无限。决策需要信息，而收集信息需要时间，但我们无法奢望有充分的时间来收集所有相关信息再进行决策。我们当然可以延迟决策，但很多时候，机不可失，失不再来，延迟决策有很大的机会成本。

面对决策能力和决策时间的双重约束，在漫长的生物演化过程中，我们的大脑形成了一种将复杂问题简单化的信息处理方式：选择参考点。到任何情境中，我们首先会确定一个参考点，然后围绕这个参考点，在“相对尺度”上，而非绝对尺度上处理信息。

很多情况下，使用参考点的确会极大地简化决策，我们也因此获益匪浅；但很显然，一旦我们接受了错误的参考点，我们就会做出并不靠谱的决策。

最厉害的人，就是可以在合适的情景选择合适的参考点，可以在大尺度参考点和小尺度参考点之间，恰如其分地“自由切换”。这种境界，我们一般人，虽不能至，但也可心向往之。

好消息是，行为经济学的诸多研究，不但告诉我们会做不靠谱的非理性决策，而且还告诉我们为什么会做出这些不靠谱的非理性决策，因为多巴胺，我们“人人都有神经病”。

但知识就是力量。我相信，一旦弄清楚了非理性决策的原因，我们将更有可能“对症下药”，让我们的决策更理性，生活更美好。

再次引用曾子的话：吾日三省吾身。为什么要这么做？这就是要让时刻提醒自己，不管身居何处，都不可以忘了那些应该一以贯之的决策参考点。

《五分钟经济学》，是复旦大学经济学院寇宗来教授推出的经济学系列作品，旨在用通俗的语言、丰富的案例，阐释经济学的思维逻辑和分析方法。

话题：