基于欲望的人工智能(三)

战国时期,有一个宋国的农夫,他每天都到森林里去游走。有一天,农夫又像往常一样到树林游走的时候,看到一只跑得非常急的兔子,从草丛中窜出来时,竟然不小心一头撞死在一棵大树旁。“哇!怎么有这种事?我真是幸运。要是天天有这样的兔子,那真的很爽!”农夫心想。从此以后,农夫每天就坐在那棵大树下,等候兔子来撞树。

关于守株待兔的故事,大家应该都很熟悉。故事中农夫从发生了一次兔子撞树的事件中获得了愉悦,于是他每天都站在那棵树下,等待再次获得同样的愉悦。虽然在我们看来这个农夫很愚蠢,但是整个过程如果把农夫换成机器,把兔子换成一次时间和空间的巧合,那么守株待兔就是一个成功的人工智能。在开始写这一篇之前 ,我读了一下彼得写的他对我们讨论过的人工智能的阐述,觉得写的很好。特别是关于记忆带来逻辑能力和关联式记忆,应该可以从下面的例子中找到一些影子。这只是我们把前篇的讨论放在这个例子上的一种尝试。可行与否,要等阐述完才能知道。

还是拿出我们只有时间和空间的二维矩阵,来当作当前这个机器的记忆。纵轴代表时间,横轴代表空间。时间为 7 刻钟重复一次,相当于我们 24 小时的一天。空间为由 A 至 G 的 7 棵树,代表机器人所能行动的整个一维世界。注意,机器在空间里是双向的,但是在时间里是单向的。它可以改变它所处的空间的位置,但是却不能改变它所处的时间的位置。这是我们的常识。然后,我们假设机器的愉悦集里只有一个愉悦,代号叫做。而当机器刚刚进入它的世界的时候,欲望集为空。现在的机器对任何一刻时间和任何一步空间都没有关于爽的记忆,所以矩阵里面的每个格子为 0 或者可以说为空。

before.png 

图一:爽之前的记忆

此时的机器没有任何欲望,所以它的行为是未知的。于是它开始在空间和时间里无欲望地乱走 —— 记住,虽然时间是单向的,但是可以循环。就这样,不知道过了多少次循环,或者说不知道过了多少,一切开始有了转机。也就是今天 3 刻的时候,机器站在了树 C 。而在此之前,它从来没有在这个时间出现在这个地点过。此时此刻,它有了一种从来没有过的变化,那就是愉悦集里的那个唯一的愉悦处于某种原因被(3 刻树 C)这个事件产生了。

画外音:“机器同学,请问你现在有什么感觉?”

机器:“爽!”

紧接着,一个包含了(3 刻树 C)和  的欲望就被生成,并加入了机器的欲望集。而在机器二维矩阵的记忆里,在(3 刻树 C)的位置,愉悦强度从 0 变成了一个很高的数值,假设为 6。然后向相邻的时间和空间递减。也就是说,此后的机器,越接近(3 刻树 C)它就越爽。

after.png

图二:爽之后的记忆

于是在(3 刻树 C)事件发生之后,机器希望这个事件再次发生。因为它拥有在空间里行动的能力,它会向树 C 走去,直到到达目的地。这个方向可以由机器记忆里每个删格的愉悦强度来决定。可惜时间是单向的,机器并没有能力像空间行走一样走回上一刻。但是机器一直努力会让自己处于离最近的时间和空间上。这个努力可以用图二中的红箭头来表示。红箭头的尾部代表机器出发的时间和空间,红箭头的头部代表机器在自己能力范围内能到达的时间和空间。最终,它会站在 树 C 的位置,等待下一个 3 刻的到来。

能不能再爽一次,就要看机器的造化了。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注