基于欲望的人工智能（三）

战国时期，有一个宋国的农夫，他每天都到森林里去游走。有一天，农夫又像往常一样到树林游走的时候，看到一只跑得非常急的兔子，从草丛中窜出来时，竟然不小心一头撞死在一棵大树旁。“哇！怎么有这种事？我真是幸运。要是天天有这样的兔子，那真的很爽！”农夫心想。从此以后，农夫每天就坐在那棵大树下，等候兔子来撞树。

关于守株待兔的故事，大家应该都很熟悉。故事中农夫从发生了一次兔子撞树的事件中获得了愉悦，于是他每天都站在那棵树下，等待再次获得同样的愉悦。虽然在我们看来这个农夫很愚蠢，但是整个过程如果把农夫换成机器，把兔子换成一次时间和空间的巧合，那么守株待兔就是一个成功的人工智能。在开始写这一篇之前，我读了一下彼得写的他对我们讨论过的人工智能的阐述，觉得写的很好。特别是关于记忆带来逻辑能力和关联式记忆，应该可以从下面的例子中找到一些影子。这只是我们把前篇的讨论放在这个例子上的一种尝试。可行与否，要等阐述完才能知道。

还是拿出我们只有时间和空间的二维矩阵，来当作当前这个机器的记忆。纵轴代表时间，横轴代表空间。时间为 7 刻钟重复一次，相当于我们 24 小时的一天。空间为由 A 至 G 的 7 棵树，代表机器人所能行动的整个一维世界。注意，机器在空间里是双向的，但是在时间里是单向的。它可以改变它所处的空间的位置，但是却不能改变它所处的时间的位置。这是我们的常识。然后，我们假设机器的愉悦集里只有一个愉悦，代号叫做爽。而当机器刚刚进入它的世界的时候，欲望集为空。现在的机器对任何一刻时间和任何一步空间都没有关于爽的记忆，所以矩阵里面的每个格子为 0 或者可以说为空。

图一：爽之前的记忆

此时的机器没有任何欲望，所以它的行为是未知的。于是它开始在空间和时间里无欲望地乱走 —— 记住，虽然时间是单向的，但是可以循环。就这样，不知道过了多少次循环，或者说不知道过了多少天，一切开始有了转机。也就是今天 3 刻的时候，机器站在了树 C 。而在此之前，它从来没有在这个时间出现在这个地点过。此时此刻，它有了一种从来没有过的变化，那就是愉悦集里的那个唯一的愉悦处于某种原因被（3 刻，树 C）这个事件产生了。

画外音：“机器同学，请问你现在有什么感觉？”

机器：“爽！”

紧接着，一个包含了（3 刻，树 C）和爽的欲望就被生成，并加入了机器的欲望集。而在机器二维矩阵的记忆里，在（3 刻，树 C）的位置，愉悦强度从 0 变成了一个很高的数值，假设为 6。然后向相邻的时间和空间递减。也就是说，此后的机器，越接近（3 刻，树 C）它就越爽。

图二：爽之后的记忆

于是在（3 刻，树 C）事件发生之后，机器希望这个事件再次发生。因为它拥有在空间里行动的能力，它会向树 C 走去，直到到达目的地。这个方向可以由机器记忆里每个删格的愉悦强度来决定。可惜时间是单向的，机器并没有能力像空间行走一样走回上一刻。但是机器一直努力会让自己处于离爽最近的时间和空间上。这个努力可以用图二中的红箭头来表示。红箭头的尾部代表机器出发的时间和空间，红箭头的头部代表机器在自己能力范围内能到达的时间和空间。最终，它会站在 树 C 的位置，等待下一个 3 刻的到来。

能不能再爽一次，就要看机器的造化了。

基于欲望的人工智能（三）

赞过：

相关

发表回复取消回复

赞过：

相关

发表回复 取消回复

发表回复取消回复