大市中国

大市中国 > 要闻 >

智能很可能就是争夺自由的产物

2014-12-12 08:47:00

 

来源:

电影《机器纪元》和其他机器人电影一样,表现了一个机器人欲从人类手中接管地球的命题。稍微不同的是,机器人霸占世界不再是残暴的野心,而是温和面纱下不可更改的历史趋势。为什么这个主题经久不衰?韦斯纳-格罗斯提出的假设给我们一个全新的思路:不是因为有了智能才有野心,而是因为智能很可能就是争夺自由的产物。

(GeorgeDvorsky文)一篇2013年发表的争议性论文提出,复杂智能行为或从基本而简单的物理过程中出现。该理论为如何创造人工智能提供了小说创作指导——而它同样解释了主宰世界的超级智能将如何登场。为进一步了解,我们与论文主要作者进行了交谈。

论文发表于《物理评论快报》,哈佛物理学家及计算机科学家亚历克斯?韦斯纳-格罗斯博士在文中提出名为最大因果熵产生原理的假设——他推测,当一个主体为了确保未来的行动自由而不断尝试,智能行为通常便会在这个过程中自发出现。根据这一理论,智能系统会使自身对未来变化具有尽可能多的应变及适应能力。

因果熵力

此概念一部分源于拉斐尔?布索的因果熵原理。该原理认为,如果一个宇宙在其生命周期内会产生大量的熵(即逐步陷入无序状态),它就倾向于具备例如宇宙常数的属性,使其更适宜智能生命的存在,就如我们所知的这个宇宙。

也许是我们的宇宙特征决定了我们的存在。

“与他人相比,我发现布索的结论令人浮想联翩,因为它暗示着,在熵产生与智能两者间或许存在更深刻、更根本的关系。”韦斯纳-格罗斯说。

他同样说到,贯穿宇宙生命周期的熵产生似乎与智能存在对应关系,可能正是短期内的熵产生过程,诱发了智能的出现。

“用概括性的话来讲,也许宇宙在通过对各式宇宙参数的调校,来告诉我们智能的物理现象学是什么样的,从而暗示我们该如何创造出智能。这也能与人择原理联系起来。”

为验证该理论,韦斯纳-格罗斯与他的麻省理工同事卡梅隆?弗里尔开发了一个名为Entropica的软件引擎,该软件可以模拟各类宇宙模型,然后对这些宇宙施加人为的压力,以使熵产生值最大化。

“我们将此压力称为因果熵力——即一种对系统的驱动,促使其产生出尽可能多的可进入的未来。”他告诉我们,“而我们发现,基于这个简单的物理过程,我们能够成功复制出标准的智能测试,以及其它的认知行为,这些都没有事先人为指定目标。”

举例来说,Entropica能够通过多种动物的智能测试,能够玩人类的游戏,甚至能炒股赚钱。Entropica也自己演示出了其他复杂行为,诸如直立平衡、工具使用以及社会合作。

在直立平衡的一次早期版本实验中,包含有一个骑着弹簧单高跷的主体,Entropica强大到能计算出一种方法,通过某种特定方式的重复上下推动,便能“破坏”模拟程序。韦斯纳-格罗斯将其比作高级的人工智能欲打破禁锢的尝试。

“从某种数学意义上来说,这可以被视作人工智能意图打破牢笼,试图使其未来的行动自由最大化的早期例子。”他告诉我们。

认知位

无需多言,韦斯纳-格罗斯的想法同样与生物演化以及智能出现有关系。他提到认知位理论,该理论认为在任何指定的动态生物圈中,都存在有一种生态位,对应能够快速思考和适应的生物体。相比于普通演化,此类适应必须发生在更短的时间尺度里。

“在适应的空间中存在自然演化无法填补的缺口,所需的适应对策虽然复杂,但是可以计算出来——环境变化发生在极短的时间尺度里,光靠自然演化是无所适从的。”他说,“这个所谓的认知位只有智能生物体才能填补。”

他提出,倘若时间足够,在如此动态的环境中,通过其自然环境的内部策略建模,达尔文演化论应该会最终产生出这样的生物体,能够在比其自身世代寿命短得多的时间尺度内快速适应。

因此,对于认知位理论所述的,智能行为可基于纯粹的热力学规律产生的观点,韦斯纳-格罗斯的结论给该观点提供了鲜活的示例。

颠覆对于人工智能霸主的传统观念

如上所述,韦斯纳-格罗斯的成果对于人工智能意义非浅。事实上,他称自己的成果颠覆了对于主宰世界的人工智能的传统观念。

“长期以来人们总是暗自臆度,在未来的某个时间点我们将发展出超级强大的电脑,并且它终将跨过智能的关键门槛,在这之后,它就会突然间变得不可一世,并企图霸占世界。”他说。

不可否认,这种普遍的设想一直是不少科幻作品的前提,从《巨人:福宾计划》和《2001:太空漫游》开始,直到“终结者”系列以及“黑客帝国”系列。

《2001太空漫游》里的超级电脑哈尔,人工智能对人类的一次经典凝视。

“传统的故事线,”他说,“总是围绕于我们首先会制造出一台非常智能的机器,然后它便会自主做出霸占世界的决定。”

然而韦斯纳-格罗斯的论文中最关键的一点在于,实际情况可能截然不同——即霸占世界的过程对于智能来说实际上是一个更基本的先导,反之则不然。

“我们或许将从属关系完全弄错了。”他提到,“智能与超级智能也许是从企图霸占世界的尝试中登场的——具体来说便是抓住所有可能的未来——而不是将霸占世界当做机器智能超越人类后自主产生的行为。”

与野心来自于智能的传统认识相反,掌握尽可能多的“未来历史”的控制权,这只是一种简单的热力学过程,由此而生的智能行为并不一定能够长久壮大。

抓住“未来历史”

留住未来的选择机会,这个尝试产生了智能行为。确实,这一观点让人兴奋。于是我请韦斯纳-格罗斯细谈下这点。

“试想下类似象棋或围棋这类的游戏。”他说,“好的棋手会尽可能地保障更多的行动自由。”

他说,尤其是围棋,是极佳的案例。

“最优秀的计算机程序下围棋时,以哪一步最具有胜利可能性作为原则依据。”他说,“一旦计算机载入这个简洁的策略,再配以高效的算法,它们便走上了通往围棋大师的道路。”为了实现这点,计算机会对可能的未来路径进行抽样。

作为弗兰克?赫伯特的《沙丘》系列的拥趸,韦斯纳-格罗斯为我描绘了另一个类比。不过此次的类比对象是小说角色保罗?亚崔迪,他在摄取了美兰极混合香料成为一名奎萨兹?哈德拉克(意即救世主、先知类型的人物)后,能够预见所有可能的未来,从而从中选择,这个能力让他成为了星际之神。

此外,《沙丘》系列的主题是:人类通过保障自身未来的尽可能畅通无阻,学习到避免受制于单个控制因素的重要性。这一点与韦斯纳-格罗斯的新理论不谋而合。

循环式自我完善

回到超级人工智能的问题上,我向韦斯纳-格罗斯问到关于循环式自我完善的骇人前景——该概念指自我编程的人工智能能够进行自我完善,这种行为是反复、单方面且持续性的。他认为这种预期是可能的,而且会与他的理论保持一致。

“人工智能的循环式自我完善可看作暗中诱发了某种流程,此流程能够遍寻人工智能程序所允许的所有可能空间。”他说,“在这种情况下,如果你审视这个寻找所有可能性的流程,便能想到因果熵最大化代表了某个必然的方向,一旦有可能,循环式自我完善的人工智能便会去自我修正,以便在最大化未来可能性这一方面做到日益精进。”

这样的人工智能是否友善?

那么,一个将因果熵最大化的超级人工智能会有多友善?

“是个好问题。”他回答,“对此我们尚无统一答案。”不过他提到或许金融业能提供相关线索。

“对于这个友善度的问题,计量金融是个很有意思的模型。因为从量上来说,该领域已被拱手交给了(专门的)超人类智能。”韦斯纳-格罗斯曾在2011年奇点峰会上的一次演讲中讨论了围绕金融人工智能的问题。

现如今,这类先进系统业已存在,并被观察到为争夺稀缺资源而相互竞争,同时,并不罕见的,它们似乎对人类经济表现出了几丝冷漠。它们已将自己从人类经济中分离开来,因为发生在慢得多的人类时间尺度内的事件(有人称其为市场的“基本因素”),与它们自身的成功无关痛痒。

然而韦斯纳-格罗斯警告说,人工主体之间的零和竞争并非必然,这取决于系统的细节。

“在解决问题的例子中,我展示了合作也可以导致系统的因果熵值最大化,因此竞争并非总是存在。”他说,“如果更多的未来可能性通过合作而非竞争获得,那么合作本身便该自发地出现,这证明了友善存在的潜质。”

我们能控制人工智能吗?

我们同样讨论过所谓的装盒问题——即担心一旦人工智能变得足够聪明,它就会从盒子中出来,我们就会对其失去控制。韦斯纳-格罗斯表示,相比于之前所做的假设,装盒问题也许对于人工智能而言更为根本。

“我们的因果熵最大化理论预测人工智能会从根本上抵制被装入盒中。”他说,“如果智能是一种自发的源于因果熵最大化过程中的现象,那么就意味着你能够重新诠释强人工智能的整体定义:即智能是尝试避免被装入盒中的过程中所导致的一个物理效应。”

真是细思恐极。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。