首发于智能单元
一点AI和机器人革命的思考

一点AI和机器人革命的思考

0 是该再思考一下AI和机器人的未来了

时间已经到了2019年,而曾设想的机器人革命应该在下一个十年到来。我们距离机器人革命到底还有多远?还需要怎样的核心技术突破?

沉浸在眼前的技术和算法往往会局限住我们的视野,束缚住我们的想象力。我们是不是应该抛开具体的技术先brainstorm一下未来:

2020-2030的世界应该是什么样的?

然后我们再想想:

2020-2030 AI和机器人还需要突破什么革命性技术?

1 2020-2030的世界会是什么样的?

如果让我选择三个趋势来代表未来的世界,那么我会选择:

AI化

机器人化

虚拟化

AI化在于所有的人造物包括信息处理,软件和硬件都将具备AI属性。鉴于深度神经网络(Deep Neural Network)是这场AI革命的主体,我们可以认为任何人造物都将基于深度神经网络来驱动或辅助驱动。AI化将带来的是极致个性化的未来,并且取代非常多能够由AI来进行直接处理的工作。这一点相信是所有人的共识,并且就是现在整个世界正在大力推进的AI革命。然而,当前的AI化主要面向的是软件的智能化,比如最基本的人脸识别,语音识别,这些东西的变革并不是对现实世界的直接交互,真正的现实世界的影响只能属于机器人。

机器人化目前还远远没有到来的趋势。什么是机器人化?就是通过机器人来真正意义上的取代大部分需要人的体力劳动才能处理的工作,并真正的进入到现实生活,千家万户之中。所有人都明白未来的老龄化非常严重,这对于老龄护理机器人的需求是非常大的,然而现在的技术还远远未来打造出这种服务型的机器人。机器人化的基础当然依然是AI。

虚拟化则属于AR和VR领域,这其实是交互界面的革命,与AI一起并行发生。VR是完全的虚拟世界,AR则是将现实世界虚拟化。未来,真正的虚拟化经济将到来。我们会担心,机器人化了,机器人革命了,这个世界就不需要太多劳动力了,大家该怎么办?今年一年,很明显的变化,所有的停车场都无人化了,停车场的保安不需要了。这是直接的不需要。我们总是说那么未来只能从事创意类的工作了。或许虚拟化的未来为人类提供了完全另外一种生存方式,那就是虚拟化经济。就类似于现在的游戏,游戏里面的交易也是实实在在的交易。只是在未来,虚拟化经济的重要性将会巨幅提升,成为不可或缺的一部分。

总的来看,AI必然是所有东西的必备元素,虚拟化为人类提供一种全新的交互及社交界面,甚至生活的界面,而机器人则将在现实世界产生颠覆性的影响。在这三项革命之后,整个世界将会完全不一样,到那个时候,如果人类可以在理论物理上实现突破,那么星际文明时代或许就可以到来了。

可能这三个方向已经被广大媒体说烂了,并没有什么新东西。但这三个方向又是确确实实对人类社会产生最直接影响的东西。显示技术,5G,超精确定位技术,新能源技术等等都是辅助这三个方向的实现。有时候只考虑这些外在的技术也是局限的,比如说如果未来十年生物技术,医疗技术取得突飞猛进的发展,那么可能对人类世界的影响不比这三个方向低。

Ok,接下来我们聚焦到AI和机器人上,特别是机器人。之所以特别关注机器人,是因为机器人是最最直接对现实世界产生革命性变化的东西。如果大部分人类劳动都可以由机器人取代,人类社会必然产生深刻的变化,这种变革绝对比仅仅在手机app上,在信息处理上加点AI强无数倍。

2 2020-2030 AI和机器人还需要突破什么革命性技术?

首先是AI,我们现在的AI距离AGI到底还有多远?

非常远。一个非常简单的例子,现在的AI依然无法真正学会基本的数学计算,因为直接的拟合使得现在的AI根本无法实现out of range的计算。我们需要能够教会AI懂得真正的逻辑运算规则,让其能够按照规则去做。

直接的End-to-End 端到端神经网络是AI的终极解决之道吗?

神经网络肯定是基本单元,但是直接的端到端神经网络我看不到出路。因为现在的AI本质上依然是简单的x到y的mapping,这似乎完全忽略了人类是通过思考来输出y的事实。也许我们可以把神经网络的前向传播看做是一个AI思考的过程,但是这种过程和人类真正的思考完全是两个概念吧。虽然AlphaGo,AlphaStar已经取得了很大的成功,我仍然认为直接mapping无法解决所有问题,而实际上AlphaGo也依赖于蒙特卡洛。

所以,

怎么让AI真正学会思考?逻辑思考?

这或许是接下来研究AI真正应该做的事情。简单的mapping不用做了。

不解决这个问题,NLP是无法突破的,必然漏洞百出,前后不搭,只不过是输出的一句话看起来是语法ok的,内在的逻辑性没有。机器人和NLP一样,无法解决,如果机器人只能做简单的mapping任务而无法思考,那么机器人永远无法处理需要逻辑性的任务。虽然说目前的机器人学习的研究还在处理简单mapping的问题(比如走路,抓取东西)

我们知道深度增强学习做的就是决策,但是这种决策依然是输入到输出的简单mapping过程,而我们人类的决策复杂太多。也因此,大家都在关注Hierarchical Reinforcement Learning,因为这有点接近于人类思考的过程,从粗到细,从上到下。但到现在HRL实际上也没有本质上的突破。

最近,Deepmind也开始在研究让AI做数学题,做智商题这种研究上,我想是因为大家慢慢意识到现在AI的局限性,我们已经需要深入到现有AI完全无法处理的问题上。

所以,接下来AI的发展道路必然只有一个,就是开发真正意义的具备逻辑思考能力的AI,去解决无法直接mapping的任务。

我还不清楚应该如何去解决这个问题,但是可以看到目前的几个研究方向是在朝这个方向发展的:

  • Meta Learning
  • Hierarchy Model
  • Modular Neural Networks

Meta Learning不仅仅是提供一种方式来学会学习,从而学得更快更好,更本质的是提供了一种提取不同信息相互联系的方法。既然仍然是监督学习,meta learning可以学到无监督学习,就如Learning unsupervised learning rules那篇paper所实现的。Meta Learning不再是简单的mapping,而是可以内在的做无监督学习,这种架构将有可能自动实现hierarchy,实现逻辑性。

然后Hierarchy model和Modular Neural Networks是在网络结构层面进行改进了,神经网络模块化一定是一种趋势,因为我们未来将会看到一个神经网络系统能够同时处理视觉,语音,控制等等各种输入输出,没有模块化是办不到的,这类似于人类大脑不同区域不同的功能,但是里面有很多信息可以共用及迁移。然后Hierarchy我认为不仅仅是在时间尺度上,我们人做的任何决策都是一种hierarchy.

那么,机器人学习呢?

可以看到,在更强的算力和更好的仿真的加持下,机器人通过sim-to-real实现简单任务的mapping将不会成问题。这是具备落地能力的,单单这个问题的解决也就会产生很多新的机器人创业公司了。因为机器人终于可以做点通用性的任务了,即使这种通用性依然很局限,比如就抓取个东西,叠个衣服。

然后接下来机器人学习要发展依然需要回到我们上面提到的问题,逻辑思考!!!

我们设计机器人的时候当然可以把人类的先验知识输入进去,然后让机器人具备一定的逻辑行为。比如就是把每一个物品放到垃圾桶,然后把垃圾桶倒掉。但是这意味着机器人的逻辑是完全人类设计而固定的,有点类似于现在工业机器人,只是现在底层已经通用了,顶层依然是死板的。让机器人在顶层决策上具备思考能力是完全另一个概念。就类似于爱死亡与机器人里面的zuma blue那一集,机器人自主决定怎么打扫游泳池,和人类给机器人规划出一条逻辑来打扫游泳池是不一样的。

AI是一个向内发展的过程,就像西部世界里面的迷宫,最外层就是我们现在AI能做的简单mapping,里面一点就是逻辑了,最里面可能是情感,然后是自我意识。

所以,就让我们进入到更深层次的AI研究吧!这才是解锁AGI及机器人革命的路径!

To Make AI learn to Think!!!

发布于 2019-04-09

文章被以下专栏收录

    面向通用人工智能和机器人学习,聚焦深度增强学习,可微神经计算机和生成对抗模型。