个人认为的智能AI(拟人机器人AI)的各个发展阶段

说起机器人AI，大家应该都明了。比如电影里面的终结者，日漫中的Chobits，现实生活中也不乏有各种各样的机器人。

那么对于一台用程序来控制的机器，我们应该怎么让其变得像人一样呢？如果真的变得和人一样，那么机器人可能会统治人类么？那么，我就从现有的聊天机器人说起吧。

以NBG实验体为例:

Need-Being
→ 早上好
N B G 实验体
→ 早上好喵~
Need-Being
→ 今天又中二了
Need-Being
→ 晚上好
N B G 实验体
→ 晚上好~喵~哥哥
Need-Being
→ 晚安
N B G 实验体
→ 晚安~喵!
Need-Being
→ 88
N B G 实验体
→ 主人再见~

通过这段对话，很容易看出来“今天又中二了”这句话没有回应。因为数据库中不存在相对应的回答语句。所以AI不进行回答。

相对的，我们来看一个真人的例子：

群里来个新人…大概是一个11岁的萝莉。
很礼貌地打了声招呼之后，便开始看我们在聊什么。
因为她听不懂我们说的网络用语，她开始问那些是什么词是什么意思了。
但是没有人回答她…
在3次被无视之后，她很有礼貌说了离别词之后退群了。

你会发现她的行为和AI很像…只不过，AI并不会(闹脾气)退群…

再看一个例子…(为了保护隐私，“由理”、“姬娅”和“包子”均为化名。NB为Need-Being的简写。由理年龄大约为12-14岁左右。)

由理: 姬娅姐姐好
由理: 群主哥哥好
ＮＢ: 由理好
由理: 嘻嘻
包子: 楼上面生啊
包子: 0 0
由理: 臭包子好
ＮＢ: 谁教的臭包子
由理: 姬娅姐姐说烂包子的
由理: 不可以？

如果你把由理认为是AI，然后再看上面这个对话，你会发现：人在某种程度上的反应是和NBG实验体(智能AI)的反应非常类似。而且年龄越小的小孩，越像AI。

以这个发现为基础，经过逆向的推算，得到一个结论：完美的AI就是模拟人的成长。

一个人刚出生，就开始牙牙学语了。这时候母亲会教孩子叫“妈妈”。但是小孩并不知道这个是什么意思，只是做条件反射而已。看到母亲就会叫“妈妈”。
这个就是目前 NBG实验体所处在的阶段…

因为AI和真人不一样。真人会因为生理需求而发出不同反应，比如呼吸、吃饭、内急等等。而AI不会，也不需要这个…
然后小孩就会被大人带着去各种地方，这个过程就是学习过程了。但是和刚出生的小孩的逻辑差不多，只是模仿，而不是自主造句发言。
相对应的，AI会有学习系统来模仿人类的这种行为。把AI由监护人(通常是制作者)领着去各个社区（例：QQ群）去学习一些基础对应语句。当然也可以全部由制作人输入数据。
以NBG实验体为例：这个步骤就是“提问好累啊回答您辛苦了！”。

但是你也可能发现这个问题…虽然学习了，但是无论是小孩还是AI，他都不知道这个对话到底是好还是坏。
小孩在这个时候容易学坏… AI么，大家都有调教过，和人类一样也容易学坏，特别是在不恰当的社区内。
所以AI现在需要的就是…根据关键字来区分什么是好的，什么是不好的。但是这些关键字的好坏，及程度都需要有人来教。就像是孩子的监护人教孩子什么是好，什么是坏一样。

在这个阶段 AI 应该已经可以识别 “哦。” 和 “哦。。” 是一样的东西了…
但是对话之间的联系，还是不存在的… 所以它无法正确地进行连贯对话，就好像人类的“童言无忌”。

提问：在这个牙牙学语之后，一个人类小孩要做什么？
这个问题很简单，上幼儿园，小学，初中，高中，大学…等等。相对应的AI也需要这些步骤，我将一一说明。

提问：幼儿园里教小孩什么东西？
我个人的感觉就是…在幼儿园里实际什么都没学，而是不停地和其他小孩和老师交流和交际。
这个过程实际是教学机构弥补父母在初期上的教学不足。
这一步，AI可以跳过…因为这个阶段的内容和上一个阶段的内容相对类似。
这就是为什么…很多机器人产品说他们的产品具有4~5岁小孩的智商的原因(当然，只是我的猜测)。

之后是小学阶段，学的东西，最重要的莫过于语文和数学了（现在的话，还有英语）
这个阶段，对于小孩很困难。对于AI来说是一个技术上的难点。

作为中文的母语使用者，自己的中文说出来，是有语法的么？
你灰发现，自己说出来的中文并不是按照语法说出来的。那么我们是怎么说出中文的呢？
答案我认为式，这些中文语句都是你听来的。别人说什么，你模仿就是了。这个东西其实就是1-6岁人类就具有的能力了。也就是在这6年间所有积累的基础固定搭配，当然在6岁以后，也会继续积累。
在这里，我把AI达到1-6岁人类智商的阶段定义成A阶段。

提问：小学语文教什么，还记得么？
“1、能写一手好字；2、有着良好的表达能力；3、能写一手言之有物、言之有序的小文章（以记述文为主）”(来自百度搜索)
实际呢，1年级的小学生是学拼音，反义词，造句什么的
拼音的话，AI这个很简单…通过数据库很容易就能知道某个汉字怎么读。或者给出拼音写出汉字（实例参见“输入法程序”）
反义词么，也可以通过数据库来完成…相应的近义词也可以这么做。结合A阶段的好坏认知，就很容分辨出褒义词和贬义词了。

难点就是造句。造句之所以难，是因为造句需要的东西
1. 语法。中文的话，就是主谓宾。这个东西估计到了初中老师还在强调。
2. 固定用法。比如上面写的 “之所以….，是因为….”这样的句式
3. 情感…等等其他（暂时还没想到）

语法 <- 让AI造句不是难点，但是让AI识别就很困难了。
如果能正确识别，那么就能造出世界上相对完美的翻译软件了。（相当于初级、中级翻译）
当然现在还不行。（实例参见“谷歌翻译”。机翻还不是非常完美，经常会出错。）

固定用法 <- 这个比较简单…都是固定用法了，直接数据库配对就好了

情感和感情…这个目前不可能。因为AI是绝对客观的东西，不会都到感情的波动。如果要实现的话，得把心理学研究透彻，然后通过模拟人类的行为来实现这个功能。不过这样的话，可能事先设定的机器人三原则，会被这个模块突破。因为人类是会违抗上级命令的。

数学 <- 这个对于AI来说没问题。毕竟是客观的东西，而且是计算机擅长的。算起来肯定比人快。

到了这个阶段结束，即小学阶段，我称之为B阶段。你会发现AI已经具有一定的逻辑了。像个小学生了。

你说一句话，它会分析你说的话，然后判断你说的话是好，还是坏。随后，根据数据库里的东西，给出一个相应的回答。当然你问它不知道的东西，它还是什么都不告诉你。

在B阶段结束的时候，已经会分析主谓宾即分析语法的机能了。
利用这个机能，就可以让AI进行模拟场景了。

举个例子:

现在有一个苹果。 ->
有一个人拿起那个苹果。 ->
苹果被那个人吃掉了，留下了苹果核 ->

人类看到这三行字，会在脑中想象。想象有一个苹果和一个人，然后在吃苹果，最后剩下了一个苹果核。

AI也可以和人类类似：

现在有一个苹果。 ->
— AI分析
时间：现在
新建一个Object: 苹果
数量：1

有一个人拿起那个苹果。 ->
新建一个Object: 人
数量：1
被操作物体：苹果
动作：拿
随后就变成了
人.拿(苹果)
用英文的话话就是 person.take_up(apple);
是不是很像程序代码？

苹果被那个人吃掉了，留下了苹果核 ->
同样的道理，不过可以先通过“被动句”转换成“把字句”
那个人吃掉了苹果，留下了苹果核。
person.eat(apple); 这个函数返回的值为叫“苹果核”的一个object

看下面这个对话 (人 “->”, AI “<-” )

现在几点 ->
<- 现在3点25分了
4小时前是几点 ->
<- 11:25～喵
那个时候我在做什么 ->
<- 让我来查查…
<- 对我说了句“我回来了”，喵~
还记得你回答了什么嘛？->
<- 还记得，喵～
是什么？->
<- “欢迎回来，主人～”
很好。->
<- 嗯。

B阶段就可以达到这种程度了…
A阶段的AI，似乎也能模仿到这个程度。但是会有问题。
“那个时候我在做什么” <- 这个提问是基于上面一句话的。A阶段AI，必须要把所有可能性输入数据库才能实现。而B阶段AI却可以实时分析。
从这个角度上来看，应该可以发现 B阶段的AI，已经很接近真人了…

还记得当年小学的时候，老师经常会问“你以后长大了想当什么”吧？
AI会这样分析

“什么”，没有尾部符号，默认为疑问句。
动词为“当”，时间为“以后长大了”
对象“你”，也就是AI。“想”，表示做推测和估算。

通过分析出这些东西，AI就能知道发话的人要求AI做什么了。然后会搜索数据库，并把“什么”的部分，替换成“当”这个动词所匹配的名字。然后根据相应的好的程度的数值排序。比如“宅”这个词的数值最好。那么就会把“什么”替换成“宅”。然后进行造句

我以后长大了想当宅

你可以教给AI一些口癖，如“%s~喵～”
这样就变成了

我以后长大了想当宅～喵～

当然AI会思考一段时间，即检索数据库的时间。具体时间看数据库大小和AI的运算能力了。
这个就是B阶段。之后的初中，高中，大学。如果不是文课类的，学习这些知识，用B阶段的技术即可。

我个人认为的C阶段是，AI能够自行学习…即学会自学。而不是通过程序员在那里定义规则。可以的话，直接从网络获取知识。

D阶段为模拟思考…这里的思考不是只逻辑运算。而是指创新方面的。
虽然这个操作将是非常缓慢，而且很浪费CPU资源。

到D阶段的时候…人们就可以把机器人当敌人了…因为这个阶段的AI已经可以独立于人类运作了。
然后要实现D阶段的话…需要极大规模的数据库和运算能力。这个储存和运算设备可能不能达到（其实C阶段就不够用了…）

为了用现有设备达到那样的程度，可能会引入人类的记忆模式。忘掉不必要的东西。常用的东西，放在一个地方。不常用的，放在其他地方。其实现在的计算机已经是这样了…

人类记忆
浅层记忆 <-> 内存
深层记忆 <-> 硬盘

在网络服务方面

人类记忆
浅层记忆 <-> 缓存
深层记忆 <-> 数据库

它会自己进行统计。那些经常用的内容就放缓存，不常用的就放在数据库里(磁盘上)。
这个技术经常见于论坛等地方。如，论坛会把经常访问的页面生成静态缓存，以提高论坛的效率。然后每过一段时间去更新这个缓存。

好～我们来回顾一下…AI的各个阶段…

以“2012外形人攻打地球，AI就要想办法去攻击外星人”为例子好了
人输入“攻击外星人”

A阶段:

回答“人家还不会，教教人家嘛。”

B阶段:

分析出动词“攻击”，对象“外星人”，命令式语句，操作的人为自己。
我.攻击(外星人);
但是发现不知道怎么攻击外星人，所以没有实际的操作。

C阶段

在B阶段的基础，尝试在互联网上查询相关的方法。如果有，就实施。没有就返回和A阶段差不多的回答

D阶段

在C阶段的基础上，尝试所有可能性，并验证。选择其当中最佳方案，进行攻击。

想像一下，大街上混杂着和人类一样的机器人的时代……不觉得很有趣么？

个人认为的智能AI(拟人机器人AI)的各个发展阶段

Published by

Need-Being

Leave a Reply Cancel reply