基于欲望的人工智能(三)
战国时期,有一个宋国的农夫,他每天都到森林里去游走。有一天,农夫又像往常一样到树林游走的时候,看到一只跑得非常急的兔子,从草丛中窜出来时,竟然不小心一头撞死在一棵大树旁。“哇!怎么有这种事?我真是幸运。要是天天有这样的兔子,那真的很爽!”农夫心想。从此以后,农夫每天就坐在那棵大树下,等候兔子来撞树。
关于守株待兔的故事,大家应该都很熟悉。故事中农夫从发生了一次兔子撞树的事件中获得了愉悦,于是他每天都站在那棵树下,等待再次获得同样的愉悦。虽然在我们看来这个农夫很愚蠢,但是整个过程如果把农夫换成机器,把兔子换成一次时间和空间的巧合,那么守株待兔就是一个成功的人工智能。在开始写这一篇之前 ,我读了一下彼得写的他对我们讨论过的人工智能的阐述,觉得写的很好。特别是关于记忆带来逻辑能力和关联式记忆,应该可以从下面的例子中找到一些影子。这只是我们把前篇的讨论放在这个例子上的一种尝试。可行与否,要等阐述完才能知道。
还是拿出我们只有时间和空间的二维矩阵,来当作当前这个机器的记忆。纵轴代表时间,横轴代表空间。时间为 7 刻钟重复一次,相当于我们 24 小时的一天。空间为由 A 至 G 的 7 棵树,代表机器人所能行动的整个一维世界。注意,机器在空间里是双向的,但是在时间里是单向的。它可以改变它所处的空间的位置,但是却不能改变它所处的时间的位置。这是我们的常识。然后,我们假设机器的愉悦集里只有一个愉悦,代号叫做爽。而当机器刚刚进入它的世界的时候,欲望集为空。现在的机器对任何一刻时间和任何一步空间都没有关于爽的记忆,所以矩阵里面的每个格子为 0 或者可以说为空。
图一:爽之前的记忆
此时的机器没有任何欲望,所以它的行为是未知的。于是它开始在空间和时间里无欲望地乱走 —— 记住,虽然时间是单向的,但是可以循环。就这样,不知道过了多少次循环,或者说不知道过了多少天,一切开始有了转机。也就是今天 3 刻的时候,机器站在了树 C 。而在此之前,它从来没有在这个时间出现在这个地点过。此时此刻,它有了一种从来没有过的变化,那就是愉悦集里的那个唯一的愉悦处于某种原因被(3 刻,树 C)这个事件产生了。
画外音:“机器同学,请问你现在有什么感觉?”
机器:“爽!”
紧接着,一个包含了(3 刻,树 C)和 爽 的欲望就被生成,并加入了机器的欲望集。而在机器二维矩阵的记忆里,在(3 刻,树 C)的位置,愉悦强度从 0 变成了一个很高的数值,假设为 6。然后向相邻的时间和空间递减。也就是说,此后的机器,越接近(3 刻,树 C)它就越爽。

图二:爽之后的记忆
于是在(3 刻,树 C)事件发生之后,机器希望这个事件再次发生。因为它拥有在空间里行动的能力,它会向树 C 走去,直到到达目的地。这个方向可以由机器记忆里每个删格的愉悦强度来决定。可惜时间是单向的,机器并没有能力像空间行走一样走回上一刻。但是机器一直努力会让自己处于离爽最近的时间和空间上。这个努力可以用图二中的红箭头来表示。红箭头的尾部代表机器出发的时间和空间,红箭头的头部代表机器在自己能力范围内能到达的时间和空间。最终,它会站在 树 C 的位置,等待下一个 3 刻的到来。
能不能再爽一次,就要看机器的造化了。
August 23rd, 2007 at 5:37 am
又开始爽了
不过我的想法和这里描述的有些小不同,首先我的假设是“欲望”或者我说的“本性”是与生俱来的。你可以把他看成一种Hardcode Behaviour。
农夫究竟为什么会待兔?
我想是这样的:
农夫饿了,他要避免饿这种信号,于是他按照自己的记忆去解决这个问题。究竟是如何解决的我们不知道,不过至少可以想到的是那时候还没有冰箱,否则他也不会碰到第一只撞死的兔子。
机缘巧合下他看到了那只自己送上门的兔子,在这个事件发生的时候,农夫检索记忆发现原来兔子是可以吃的,或许还很好吃。于是他对兔子产生了占有的想法,决定把它拿回家解决饿的问题。
一只兔子究竟如何解决饿这个问题也关乎农夫的记忆。如果他记忆里有过煮兔子的行为,那一切都不是问题。否则他或许会被[好奇]这个本性驱使把兔子乱切一通(可怜的兔子),最后发现可以吃的肉。当然,这一切都不属于为什么农夫会待兔的讨论范围内。
关键是,农夫在享用了这只兔子后,他记忆里产生了”待兔“这整个时间的过程。或许那天他饿的真的很厉害,或许那只兔子很美味,因此这个记忆特别深刻。大脑在处理这段记忆的时候自然会把它和”饿“联系在一起,这就是所谓的关联式记忆。当下次”饿“这个信号发生的时候,农夫在重复第一步记忆检索的时候,他就会发现原来”待兔“是可以解决问题的。于是他开始重复上一次记忆里的动作。
人的记忆是模糊式的,因此他重复的动作不一定是完全一样。或许他并不会记得在哪棵树上得到过这样的经历。事实是,这段记忆很可能和”树“以及”兔子“都关联在一起。
正常人为什么不会待兔?
正常人接收过的教育,或者所有的经历都会告诉他们,兔子撞树是难得一遇的奇景。这并不代表人能够拥有逻辑能力判断什么是可能发生的事情,只不过因为这件事所形成的记忆只有一次,下次可怜的农夫再去待兔的时候,他很可能因为饿的不行而触发新的本能,放弃待兔的行为。
或者,我们给农夫家里安装一个冰箱,那样他就永远不需要待兔了。
August 23rd, 2007 at 9:32 am
Peter, 爽和不爽是相对的。当农夫碰到兔子的时候有了很爽的感觉,也就是说农夫在没有碰到兔子的时候不爽,至少没有碰到兔子的时候那么爽。这个不爽,可能就是你所说的饥饿。去寻找爽的感觉,可能就是一个寻找去避免饥饿的过程。具体的阐述,会出现在下一篇关于非愉悦的讨论里。