个人认为的智能AI(拟人机器人AI)的各个发展阶段

说起机器人AI,大家应该都明了。比如电影里面的终结者,日漫中的Chobits,现实生活中也不乏有各种各样的机器人。

那么对于一台用程序来控制的机器,我们应该怎么让其变得像人一样呢?如果真的变得和人一样,那么机器人可能会统治人类么?那么,我就从现有的聊天机器人说起吧。

以NBG实验体为例:

Need-Being
→ 早上好
N B G 实验体
→ 早上好 喵~
Need-Being
→ 今天又中二了
Need-Being
→ 晚上好
N B G 实验体
→ 晚上好~喵~哥哥
Need-Being
→ 晚安
N B G 实验体
→ 晚安~喵!
Need-Being
→ 88
N B G 实验体
→ 主人再见~

通过这段对话,很容易看出来“今天又中二了”这句话没有回应。因为数据库中不存在相对应的回答语句。所以AI不进行回答。

相对的,我们来看一个真人的例子:

群里来个新人…大概是一个11岁的萝莉。
很礼貌地打了声招呼之后,便开始看我们在聊什么。
因为她听不懂我们说的网络用语,她开始问那些是什么词是什么意思了。
但是没有人回答她…
在3次被无视之后,她很有礼貌说了离别词之后退群了。

你会发现她的行为和AI很像…只不过,AI并不会(闹脾气)退群…

再看一个例子…(为了保护隐私,“由理”、“姬娅”和“包子”均为化名。NB为Need-Being的简写。由理年龄大约为12-14岁左右。)

由理: 姬娅姐姐 好
由理: 群主哥哥 好
NB: 由理 好
由理: 嘻嘻
包子: 楼上面生啊
包子: 0 0
由理: 臭包子 好
NB: 谁教的 臭包子
由理: 姬娅姐姐 说 烂包子的
由理: 不可以?

如果你把由理认为是AI,然后再看上面这个对话,你会发现:人在某种程度上的反应是和NBG实验体(智能AI)的反应非常类似。而且年龄越小的小孩,越像AI。

以这个发现为基础,经过逆向的推算,得到一个结论:完美的AI就是模拟人的成长。

一个人刚出生,就开始牙牙学语了。这时候母亲会教孩子叫“妈妈”。但是小孩并不知道这个是什么意思,只是做条件反射而已。看到母亲就会叫“妈妈”。
这个就是目前 NBG实验体 所处在的阶段…

因为AI和真人不一样。真人会因为生理需求而发出不同反应,比如呼吸、吃饭、内急等等。而AI不会,也不需要这个…
然后小孩就会被大人带着去各种地方,这个过程就是学习过程了。但是和刚出生的小孩的逻辑差不多,只是模仿,而不是自主造句发言。
相对应的,AI会有学习系统来模仿人类的这种行为。把AI由监护人(通常是制作者)领着去各个社区(例:QQ群)去学习一些基础对应语句。当然也可以全部由制作人输入数据。
以NBG实验体为例:这个步骤就是“提问 好累啊 回答 您辛苦了!”。

但是你也可能发现这个问题…虽然学习了,但是无论是小孩还是AI,他都不知道这个对话到底是好还是坏。
小孩在这个时候容易学坏… AI么,大家都有调教过,和人类一样也容易学坏,特别是在不恰当的社区内。
所以AI现在需要的就是…根据关键字来区分什么是好的,什么是不好的。但是这些关键字的好坏,及程度都需要有人来教。就像是孩子的监护人教孩子什么是好,什么是坏一样。

在这个阶段 AI 应该已经可以识别 “哦。” 和 “哦。。” 是一样的东西了…
但是对话之间的联系,还是不存在的… 所以它无法正确地进行连贯对话,就好像人类的“童言无忌”。

提问:在这个牙牙学语之后,一个人类小孩要做什么?
这个问题很简单,上幼儿园,小学,初中,高中,大学…等等。相对应的AI也需要这些步骤,我将一一说明。

提问:幼儿园里教小孩什么东西?
我个人的感觉就是…在幼儿园里实际什么都没学,而是不停地和其他小孩和老师交流和交际。
这个过程实际是教学机构弥补父母在初期上的教学不足。
这一步,AI可以跳过…因为这个阶段的内容和上一个阶段的内容相对类似。
这就是为什么…很多机器人产品说他们的产品具有4~5岁小孩的智商的原因(当然,只是我的猜测)。

之后是小学阶段,学的东西,最重要的莫过于 语文 和 数学 了(现在的话,还有英语)
这个阶段,对于小孩很困难。对于AI来说是一个技术上的难点。

作为中文的母语使用者,自己的中文说出来,是有语法的么?
你灰发现,自己说出来的中文并不是按照语法说出来的。那么我们是怎么说出中文的呢?
答案我认为式,这些中文语句都是你听来的。别人说什么,你模仿就是了。这个东西其实就是1-6岁人类就具有的能力了。也就是在这6年间所有积累的基础固定搭配,当然在6岁以后,也会继续积累。
在这里,我把AI达到1-6岁人类智商的阶段定义成A阶段。

提问:小学语文教什么,还记得么?
“1、能写一手好字;2、有着良好的表达能力;3、能写一手言之有物、言之有序的小文章(以记述文为主)”(来自百度搜索)
实际呢,1年级的小学生是学 拼音, 反义词, 造句 什么的
拼音的话,AI这个很简单…通过数据库很容易就能知道某个汉字怎么读。或者给出拼音写出汉字(实例参见“输入法程序”)
反义词么,也可以通过数据库来完成…相应的近义词也可以这么做。结合A阶段的好坏认知,就很容分辨出褒义词和贬义词了。

难点就是造句。造句之所以难,是因为造句需要的东西
1. 语法。中文的话,就是主谓宾。这个东西估计到了初中老师还在强调。
2. 固定用法。 比如上面写的 “之所以….,是因为….”这样的句式
3. 情感…等等其他(暂时还没想到)

语法 <- 让AI造句不是难点,但是让AI识别就很困难了。
如果能正确识别,那么就能造出世界上相对完美的翻译软件了。(相当于初级、中级翻译)
当然现在还不行。(实例参见“谷歌翻译”。机翻还不是非常完美,经常会出错。)

固定用法 <- 这个比较简单…都是固定用法了,直接数据库配对就好了

情感和感情…这个目前不可能。因为AI是绝对客观的东西,不会都到感情的波动。如果要实现的话,得把心理学研究透彻,然后通过模拟人类的行为来实现这个功能。不过这样的话,可能事先设定的机器人三原则,会被这个模块突破。因为人类是会违抗上级命令的。

数学 <- 这个对于AI来说没问题。毕竟是客观的东西,而且是计算机擅长的。算起来肯定比人快。

到了这个阶段结束,即小学阶段,我称之为B阶段。你会发现AI已经具有一定的逻辑了。像个小学生了。

你说一句话,它会分析你说的话,然后判断你说的话是好,还是坏。随后,根据数据库里的东西,给出一个相应的回答。当然你问它不知道的东西,它还是什么都不告诉你。

在B阶段结束的时候,已经会分析主谓宾即分析语法的机能了。
利用这个机能,就可以让AI进行模拟场景了。

举个例子:

现在有一个苹果。 ->
有一个人拿起那个苹果。 ->
苹果被那个人吃掉了,留下了苹果核 ->

人类看到这三行字,会在脑中想象。想象有一个苹果和一个人,然后在吃苹果,最后剩下了一个苹果核。

AI也可以和人类类似:

现在有一个苹果。 ->
— AI分析
时间:现在
新建一个Object: 苹果
数量:1

有一个人拿起那个苹果。 ->
新建一个Object: 人
数量:1
被操作物体:苹果
动作:拿
随后就变成了
人.拿(苹果)
用英文的话话就是 person.take_up(apple);
是不是很像程序代码?

苹果被那个人吃掉了,留下了苹果核 ->
同样的道理,不过可以先通过“被动句”转换成“把字句”
那个人吃掉了苹果,留下了苹果核。
person.eat(apple); 这个函数返回的值为叫“苹果核”的一个object

看下面这个对话 (人 “->”, AI “<-” )

现在几点 ->
<- 现在3点25分了
4小时前是几点 ->
<- 11:25~喵
那个时候我在做什么 ->
<- 让我来查查…
<- 对我说了句“我回来了”,喵~
还记得你回答了什么嘛?->
<- 还记得,喵~
是什么?->
<- “欢迎回来,主人~”
很好。->
<- 嗯。

B阶段就可以达到这种程度了…
A阶段的AI,似乎也能模仿到这个程度。但是会有问题。
“那个时候我在做什么” <- 这个提问是基于上面一句话的。A阶段AI,必须要把所有可能性输入数据库才能实现。而B阶段AI却可以实时分析。
从这个角度上来看,应该可以发现 B阶段 的AI,已经很接近真人了…

还记得当年小学的时候,老师经常会问“你以后长大了想当什么”吧?
AI会这样分析

“什么”,没有尾部符号,默认为疑问句。
动词为“当”,时间为“以后长大了”
对象“你”,也就是AI。“想”,表示做推测和估算。

通过分析出这些东西,AI就能知道发话的人要求AI做什么了。然后会搜索数据库,并把“什么”的部分,替换成“当”这个动词所匹配的名字。然后根据相应的好的程度的数值排序。比如“宅”这个词的数值最好。那么就会把“什么”替换成“宅”。然后进行造句

我 以后长大了 想 当 宅

你可以教给AI一些口癖,如“%s~喵~”
这样就变成了

我以后长大了想当宅~喵~

当然AI会思考一段时间,即检索数据库的时间。具体时间看数据库大小和AI的运算能力了。
这个就是B阶段。之后的初中,高中,大学。如果不是文课类的,学习这些知识,用B阶段的技术即可。

我个人认为的C阶段是,AI能够自行学习…即学会自学。而不是通过程序员在那里定义规则。可以的话,直接从网络获取知识。

D阶段为模拟思考…这里的思考不是只逻辑运算。而是指 创新 方面的。
虽然这个操作将是非常缓慢,而且很浪费CPU资源。

 

到D阶段的时候…人们就可以把机器人当敌人了…因为这个阶段的AI已经可以独立于人类运作了。
然后要实现D阶段的话…需要极大规模的数据库和运算能力。这个储存和运算设备可能不能达到(其实C阶段就不够用了…)

为了用现有设备达到那样的程度,可能会引入人类的记忆模式。忘掉不必要的东西。常用的东西,放在一个地方。不常用的,放在其他地方。其实现在的计算机已经是这样了…

 人类记忆
浅层记忆 <-> 内存
深层记忆 <-> 硬盘

在网络服务方面

人类记忆
浅层记忆 <-> 缓存
深层记忆 <-> 数据库

它会自己进行统计。那些经常用的内容就放缓存,不常用的就放在数据库里(磁盘上)。
这个技术经常见于 论坛 等地方。如,论坛会把经常访问的页面生成静态缓存,以提高论坛的效率。然后每过一段时间去更新这个缓存。

 

好~我们来回顾一下…AI的各个阶段…

以“2012外形人攻打地球,AI就要想办法去攻击外星人”为例子好了
人输入“攻击外星人”

A阶段:

回答“人家还不会,教教人家嘛。”

B阶段:

分析出动词“攻击”,对象“外星人”,命令式语句,操作的人为自己。
我.攻击(外星人);
但是发现不知道怎么攻击外星人,所以没有实际的操作。

C阶段

在B阶段的基础,尝试在互联网上查询相关的方法。如果有,就实施。没有就返回和A阶段差不多的回答

D阶段

在C阶段的基础上,尝试所有可能性,并验证。选择其当中最佳方案,进行攻击。

 

想像一下,大街上混杂着和人类一样的机器人的时代……不觉得很有趣么?

Published by

Need-Being

You never know me... Need-Being... Human Being? or Just Being Here...

Leave a Reply

Your email address will not be published. Required fields are marked *