从逆男的囧境说起：「智能」也许可以来自一次一次的选择

图片：Yestone.com 版权图片库

「智能」起源的一种可能性

傅渥成，统计物理

在《世界奇妙物语》中一个故事叫《逆男》，故事里面的男主角不管做怎样的选择都会遇到挫败：例如，排队总是会排到前进速度最慢的队伍，要是恰好排到自己了说不定里面的工作人员又恰好得去吃饭了；如果同时来了两辆公交车，选择的那一辆要不是到了某一站就会挤满人，要么就是在半路会抛锚……突然这一天，这位逆男心想：既然自己的选择会错之后，那干脆每次都不按照自己的内心想法做好了，明明觉得应该排在左边，那就选择右边吧——从此，他就走上了人生巅峰，在公司的业务也做得越来越好，越来越有钱，越来越被领导赏识，唯一不满的是他的女朋友，他的女朋友觉得原来心地善良的这位逆男同学「变了」，最终，逆男面临心灵的选择——是选择抛弃女朋友，到公司的美国分部去做经理呢；还是留在日本跟女朋友在一起。他的内心无比热爱他的女朋友，但是他知道，只要是尊重内心的想法，最后的结果总是不好的，于是他无比矛盾。终于，在前往机场的路上，他最终还是按照自己内心的想法做了，他决定留在日本跟女朋友在一起，这时镜头一转，他的女朋友已经跟他的好基友在一起了，他再次做出了一个错误的选择。

在《逆男》的故事里，逆男产生了一种能力，可以做出「正确」的选择，这种奇怪的超能力是怎么形成的呢？怎样判断什么是正确的选择，什么又是错误的选择呢？

以玩游戏为例，在各类游戏中，玩家会需要在各种各样的分支中进行选择——但最终的成功者就是能坚持到最后的人。各类游戏虽然追求的目标不同，有的是为了吃掉对方的棋，有的是为了从管子之间穿过，有的是为了收集更多的装备，但是这其中有某种共同性的东西——我们自己不能死，并且，不能让自己陷入绝境，即，我们不能因为这一步当前的选择，陷入到下一步无路可走的境地。

有了这样的一个想法，我们可以很自然地来考虑「最优选择」的方向，最优的选择，就是让未来的可能最多的选择。我们希望构造一个量来描述这种现象，怎样来构造这个量呢？更有意思的，如果我们考虑一个实际的物理体系，怎样构造一种「力」，让受到这种力的物体变成「逆男」，能够总是做出「正确」的选择呢？

我在这里介绍一篇文献的有关内容。在哈佛大学和麻省理工大学工作的 A. D. Wissner-Gross 在他在 2013 年发表的一篇 PRL 文章中提出了一种方案。这种方案构造出一种「因果熵力」，系统在这种因果熵力的作用之下，可以朝着选择更多的方案上去演化。这一方法的具体推导在这里我不详细介绍，有兴趣的朋友可以直接阅读那篇论文。这篇关于路径熵力的文章可以在作者的个人主页上下载：http://www.http://alexwg.org/publications/PhysRevLett_110-168702.pdf。

我希望选取一些有意思的细节来对问题进行讨论。主要集中来说明关于这一概念的一些关键点以及几个那篇文章中介绍到的例子：

1、这种「因果熵力」只对于平移对称性破缺的系统才存在。因为如果不存在这种对称性破缺，那么往左走还是往右走其实都是一样的，因此系统需要在某个位置处存在某种约束，越过那个约束是不被允许的，因此当粒子处在边界上的时候，就像在游戏中被打倒只剩下一滴血，这时候它的选择变得更少，它能做的就只是回头了。

2、这种「因果熵力」来源于外界环境热浴带来的能量输入。因为如果没有外界能量，系统只会在传统牛顿力学、量子力学等框架下演化，而一旦有了能量输入，系统的演化可以变得更不一样一些，例如生命可以从环境中获取能量，从而逆天地建构起有序的结构；

3、考虑单粒子的情形。对于单粒子的运动，其实没有办法严格定义「温度」，不过我们可以引入一个等效的温度 T。我们这样看，规定某个起点，让粒子受到随机力、摩擦力等等的作用，从起点出发，开始演化。如果觉得一个粒子还不够过瘾，我们可以复制很多个这样的系统，在每个这样的系统里，粒子都从给定的起点出发开始演化。等到了时刻 t ，我们让所有的这些系统的演化都停下来，每个粒子都在相空间中演化出了一条轨道。如果所有的这些轨道都相当稳定，即粒子难以在不同的轨道之间发生转换，则认为此时的等效温度是很低的。

「因果熵力」可以驱动粒子朝向某种「最优」「最智能」的方向演化，我们首先在不引入这种力的情况下让系统运转起来，系统在初始时刻受到可能朝各个方向运动的随机力，也会因此演化出来各种各样的轨道，我们对这些不同的轨道进行一个路径积分，每条路径的权重就是这一条路径的信息熵，以此为权重，对那个随机力进行加权平均，这时候，权重更重的方向就会是未来可能性更多的方向——也就是前面提到的「因果熵力」的方向，也就是让系统变得更聪明、能做出更智能的选择的方向。在前面的描述中，有两个参数：其一是「温度」，「温度」反应了在不同的路径之间切换的灵活的程度，因此「温度」越高，越灵活机动，让你变得更聪明的力就越大；其二是「时刻 t」，这是我们初始进行计算时候选取的一个用于学习的时长，学习了长为 t 的历史经验，我们可以期待它有时长为 t 的远见，因此，t 越大，系统就能在越长的时段内一直被推动往更聪明的方向发展。

说了这么多，来看看具体的例子吧，这几个例子都来自于作者的原文。

例 1，粒子在一个盒子内运动，如果给它一个变得更聪明的力（即文中的「因果熵力」），那么粒子会被驱动往盒子的中心运动。因为在这里，它未来的选择是最多的。

例 2，一个「小车—硬杆」系统的示意图，也可以把它看成是用轻杆连着的一根单摆。在该系统中，硬杆最初是倒悬的，如果给小车这种「因果熵力」的作用，最终将倒悬的硬杆旋转到了竖直正立的状态，硬杆还可以稳定在该状态——这是因为硬杆直立起来之后，就有了向下摆的各种可能性，这种因果熵力正是要把系统驱动到未来选择最多的方向上去。作者还希望通过这个例子说明人类直立行走的原因，人类有灵巧的双手，只有直立起来，双腿行走（如题图），灵巧的双手才被解放出来做各种事情——这也是有某种进化的力量在驱动着生物体拥有实现更多的可能性的能力。

例 3，马克思主义者常常谈「工具的使用（和加工）」，在动物世界中，我们见到了黑猩猩用树枝吊蚂蚁；在小学课本里，我们听说乌鸦会用小石子取瓶子里的水喝；在日本，聪明的乌鸦甚至会把核桃扔到马路上，等汽车从核桃上压过去之后，等到红灯的时候，再飞下来，取外壳已经被压碎的果仁吃。作者在这里还用一个简单模型说明了工具使用的问题。如上图 (a) 中所示，圆盘 I 表示动物，跟装有目的物（圆盘 III ）的细管子相比体积太大，它没有办法直接进入管内，而工具（圆盘 II ）却正好足够小；(b) 动物（圆盘 I ）与工具（圆盘 II ）发生碰撞；(c) 工具（圆盘 II ）进入到管内与目的物（圆盘 III ）发生碰撞；(d) 目的物（圆盘 III ）被成功地从管中其初始位置附近释放出来，进而终于可以被动物（圆盘 I ）直接操纵了。这一动画可以到我在本文最后提供的地址中去下载。同样的，如果目的物一直待在管子里，那它的状态也就是总是被限制住的，只有被释放出来，才能有更多的可能性——「因果熵力」正是驱动系统往这一方向演化的、来源于外在环境的一种力。

例 4，我们来考虑与合作有关的问题。这一物理模型也有许多动物实验作为支持。在实验中，一对动物需要同步地拉动一根绳子（或者细线）的两端拉手，目的是为了取得一个位于受限制区域的物体（圆盘 III）。圆盘质量与拉力之间的关系是被精心设计过的：相比起不同步的、或单侧的拉伸，当两个动物（小圆盘 I 和 II）同步地在绳子的两端向下拉时，会对圆盘 III 产生更大的拉力。圆盘 III 只有被拉下来，才能被两个小动物（圆盘 I 和 II）玩耍（发生水平方向的运动），即只有这样才有更多的可能性。那么，这一物理体系在因果熵力的驱动下，会发生怎样的运动呢？如上图，图 (a) 是初始初始构象，并且两个小动物被特地设置成不在一条水平线上（不同步）；图 (b)中的两个动物（圆盘 I 和 II）已经自发同步了它们的位置，并且在绳子的两端把手一起向下拉；图 (c) 中，目标物（圆盘 III）已经被成功地拉到了可以被直接接触和操纵到的位置；图 (d) 中两个动物（圆盘 I 和 II ）正在直接操纵目标物（圆盘 III），并且目标物在水平杆上还可以发生水平运动。

通过以上的这些例子，我们隐约感受到了「最大化未来的可能性」与「智能」之间存在的某种联系，「因果熵力」似乎从物理学家的角度，用数学公式和计算模拟为这种尝试做出了第一步。我们甚至发现，这个例子里面举的各种实例，虽然非常粗糙，但是的确已经初步具有了表现出与生物「精神世界」「认知领域」有关的复杂行为。这一研究结果表明，开放系统中的非平衡过程作为一种普通的热力学模型，如果加上这种能驱动系统往更多可能性的方向上运动的「因果熵力」，就很可能可能具有对适应性行为进行数学建模的潜力。这篇文章发表之后，其思想被许多媒体转载和引用：

"Causal Entropy" Linked to Intelligence

Intelligent Robots Should Maximize Their Future Options

关于因果路径熵的应用的影片，可以在 Youtube 上观看，不方便上 Youtube 的朋友可以点击下载地址来下载观看。我们在网上还能看到作者的许多演讲视频，大家可以去这篇文章的作者的个人主页上去观看：Alexander D. Wissner-Gross, Ph.D.

查看知乎讨论

转载请注明：微图摘 » 从逆男的囧境说起：「智能」也许可以来自一次一次的选择