AI学人
首发于AI学人
跨界大师:人工智能人物谱(三)

跨界大师:人工智能人物谱(三)

上周四参加了36氪主办的一场投资人聚会,和老朋友陈楸帆,还有清华物理系的何珂教授一起主持了有关凝聚态物理、人工智能、虚拟现实、科幻小说的圆桌讨论,听众主要是来自不同机构的投资人,场内也有《知识分子》主编鲁白教授,雨果奖得主郝景芳女士等嘉宾在座。一次活动,可谓横跨科学、技术、艺术、投资四大界别,涵盖拓扑绝缘体、深度学习、VR/AR、科幻创作诸多话题。跨界之多,涉及门类之广,前所未闻;讨论之天马行空,气氛之轻松有趣,也是自成一格。

活动结束,倒是想起一个相关的事情:在人工智能发展的早期,跨界几乎是人工智能研究者最常见的特质。

这个其实不难理解,第一波人工智能浪潮几乎是随着通用电子计算机的诞生而迅速发展起来的。在那个时代,“计算机科学”作为一个科技门类,既不像数学、物理学一样拥有至高无上的权威地位,也不像机械工程、电子工程甚至能源、化工那样炙手可热,为人工智能奠基的大师们大多都已经在其他领域拥有了卓越的建树,许多人是用转行的方式进入计算机科学这个新兴领域的。其实,一直到今天,数学家、物理学家、电子工程科学家转行计算机的例子也屡见不鲜。

但再仔细梳理梳理,又发现事情远不止这么简单。在人工智能奠基的二十世纪五六十年代,许多杰出人工智能学者所跨的界别之广,都让我们这些后辈汗颜。他们早已超越了计算机相关专业的界限,不少人甚至超出了理工科的范畴,在文艺领域别有建树。有人也许会说,这算什么?我也能白天编程序,晚上弹吉他。注意,我这里说的“跨界”,可不是有个不同领域的业余爱好这么简单的事。下面谈到的个案,起码要受过专业训练或被领域专家认可的才能叫跨界。

一个经常被人提及的跨界大师是 Herbert Simon(中文名司马贺)。他是 1975 年的图灵奖得主,同时也是 1978 年的诺贝尔经济学奖得主。在计算机科学之外,他是经济学、社会学、政治学、心理学等诸多领域的大师。在这样一个标杆性的“跨界”人物身上,是不是能看到远古时期身兼数种角色的古典大师的身影?从古希腊的亚里士多德,到中国的墨子,古典大师们总是能在横跨文理各学科门类的同时,为后人留下自己的真知灼见……但是,慢着,慢着,这两者之间,真的有可比性吗?无论是古希腊,还是中国的春秋战国,那个年代的大师在跨界方面的难度,和今天的研究者跨越社科、理工、艺术的难度可以同日而语吗?

一方面,亚里士多德对物理学、化学的贡献,大致停留在神学向自然哲学过渡的科学萌芽期,他的理论中混杂着太多臆想、含混或推测的成分。另一方面,从艺术创作或美学鉴赏角度,亚里士多德的《诗学》其实并不比刘勰的《文心雕龙》或钟嵘的《诗品》有着更多的现实指导意义(推荐一篇相关论文:www2.tku.edu.tw/~tkjour)。这虽不能抹杀亚里士多德在文、理两方面的开创性贡献,但我们必须知道,学科萌芽期的跨界与学科成熟期的跨界是绝对、绝对不一样的两件事。亚里士多德之所以能在诸多门类同时做出开创性的贡献,一是因为亚里士多德本身就是逻辑学的开创者,而任何科学门类在萌芽期都与最基本的逻辑学思维有着比较简明的呼应关系,二是因为萌芽期的科学门类并不需要太深的领域知识积累,就足以迅速掌握并不断拓展——这同样适用于以逻辑学见长,并同时在力学、几何学、代数学、光学等理工科领域做出过早期贡献的墨子。

回到近现代,我们不提牛顿那种开挂级别、在一众领域做出过史诗级贡献的人物,单看一个横跨理工、社科、文艺三界的人杰——我知道,很多人会马上想到顾毓琇这个名字。

关于顾毓琇,知乎上有个很有意思的问题,“顾毓琇是怎样的一个人”(顾毓琇是怎样的一个人? - 名人)。问题回答者中,有的对顾毓琇的“神迹”颇为不屑,有的则直称顾毓琇是“穿越回去的人”。由此牵出的另一个知乎问题是,“有哪些人堪称「神人」,却不为大众所知”(有哪些人堪称「神人」,却不为大众所知? - 科学)。

简单且不那么夸张地说来,顾毓琇既是一个被电机工程学界认可,得到过 IEEE 奖项的大牛工程师,也是一个被文艺界认可,创作过数千首诗歌的诗人,以及撰写过十数部戏剧的戏剧家,同时,他还是一个担任过国立音乐学院院长的音乐家。从跨界的广度和深度看,顾毓琇丝毫不亚于上面谈到的 Herbert Simon。

江泽民 1946 年在交大上学时,顾毓琇是教微积分的老师。1949 年后,顾毓琇离开中国,并先后在 MIT 和宾夕法尼亚大学工作。架空一下,如果当年顾毓琇在 MIT 遇到人工智能的早期奠基者,比如下面要谈到的 Marvin Minsky(当然了, Marvin Minsky 比顾毓琇小太多,在 MIT 任教的时间也和顾毓琇相差好几年), 他会不会成为人工智能的另一位大师,成为专家系统或神经网络的发明人之一呢?


个人认为,从“跨界”一词的含金量上说,顾毓琇是胜过 Marvin Minsky 的。虽说 Marvin 既是计算机科学家,也是受过训练的音乐家,但显然无法与顾毓琇在工程师角色之外,能够创办音乐学院,拥有大量戏剧和诗歌代表作相提并论。不过,既然谈人工智能,我们就暂时别过顾毓琇,先从人工神经网络的鼻祖级人物、图灵奖得主 Marvin Minsky 谈起。

今年年初,Marvin Minsky 逝世时,中文的悼念文章并不太多,大多也没有说在点子上。喝水不忘挖井人,现在深度学习这么火,人工智能第一次在商业模式上四处开花、多方落地,AI 创业和投资新闻习惯性地占据科技媒体的头条,大家真的不该好好纪念一下人工神经网络的奠基人之一 Marvin Minsky 吗?虽说人工神经网络在 1960 年代末陷入第一波低谷的原因与 Marvin Minsky 公开指出理论的内在缺陷有关,但这似乎不应成为我们忘掉 Marvin Minsky 的理由。曾经对乔布斯和苹果影响巨大的教父级人物 Alan Kay 是这样评价 Marvin Minsky 的(nytimes.com/2016/01/26/):

“Marvin 是为数不多的人工智能先驱之一,他用自己的视野和洞见,将计算机从一部超强加法器的传统定位中解放出来,并为其赋予了新的使命——有史以来最强大的人类力量倍增器之一。”

毫无疑问,今天深度学习的繁荣至少有相当一部分是建立在 Marvin Minsky 1950 年代发表的人工神经网络相关论文,以及 1969 年发表的著作《感知机(Perceptrons)》的基础之上的。有些反讽的是,据说不少人至今仍认为,Marvin Minsky 在《感知机》里谈到人工神经网络的异或(XOR)难题时,是持悲观态度并站在人工神经网络发展的对立面的。这段公案有正反两面的不少说法,但正如 Alan Kay 所说,Marvin Minsky 在人工智能领域的历史地位从未因这些质疑而动摇过。

跨界方面,Marvin Minsky 是从计算机科学界跨到了音乐界。二战时,Marvin 当过兵。二战后,Marvin 在哈佛大学学习数学期间,也同时修习音乐。除了钢琴演奏,他还有一个特长——即兴创作古典赋格音乐。他自己将音乐家分为“创作者”和“即兴创作者”两大类。显然,Marvin Minsky 颇以具备即兴创作的能力而自豪。据他女儿回忆(The Musical Mind of Marvin Minsky),Marvin Minsky 的家中,每天夜晚的常态是群贤毕至,少长咸集,宏谈阔论,琴声悦耳。为客人弹奏即兴钢琴曲的,当然是 Marvin Minsky 本人。

我不懂赋格曲,所以,相比之下,我更喜欢 Marvin Minsky 发明的一部名叫 Triadex Muse 的音乐合成器。今天在苹果电脑或者 iPad 上玩 GarageBand 的体验,不知道有没有当年玩 Triadex Muse 那么酷。但从照片上看,那个建造于 1970 年代的“音乐三角”长得还是非常前卫,非常时髦的:

据说,Marvin Minsky 这部合成器创造了好几个历史第一。但更加值得一提的是,这部合成器其实是 Marvin 所做的一项融合了电子合成乐与早期人工智能探索的一项科技实验。有篇中文介绍文字可供参考:1971年:Triadex Muse [美国]Edward Fredkin、Marvin Minsky,其中还有操作合成器创作电子音乐的视频:

“音乐三角合成器没有键盘,但具有一个滑杆组。这一滑杆组由8个滑杆组成,每个滑杆有40个控制位。这8个滑杆中,4个用于控制音高,4个用于控制整个音序,即‘主题’。滑杆组一边的指示灯内会以视觉反馈的方式显示逻辑门的状态。另外一组滑杆可控制内置扬声器的音量、音序速度和音高。乐器上还有一组开关按钮,通过这组按钮,可以控制播放音序的方式——从头播放、逐个音符步进播放,或是把序列中最低的音替换为一段停顿。”

trovar.com - Triadex Muse Pages 可以找到这个音乐合成器的 Windows 版模拟器。至于这个合成器为什么是一种人工智能实验?我觉得可能要从那个年代人们对思维与艺术之间关联的探索谈起。其实,在 Marvin Minsky 自己看来,理解音乐是理解人类大脑的一种有效途径,反之,理解人类的大脑也有助于我们欣赏音乐的本质。Marvin 说(The Musical Mind of Marvin Minsky):

“理解大脑这件事似乎比理解音乐要难一些,但我们应该知道,有时对问题领域的扩展可以让问题变得更简单!在好几个世纪的时间里,代数方程的平方根理论都受困于由实数构成的狭小世界,但在高斯揭示出更大的复数世界后,一切都变得简单起来。类似的,一旦能穿透听众的心灵,音乐就会显示出更为丰富的内涵。”

因为对音乐与心灵、音乐与教育之间关系的研究,Marvin Minsky 也经常被人们称为心理学家或认知科学家。不过不要忘了,Marvin Minsky 本质上还是一个厉害的计算机工程师,他的另一项“不起眼”的小贡献其实也非常有趣——LOGO 语言里的小海龟,是 Marvin Minsky 和 LOGO 语言的发明人 Seymour Papert 一起创造出来的。

我自己学习 LOGO 程序设计语言的历史可以追溯到 Apple II 和中华学习机在大陆流行的年代。那时,我肯定没有认识到, LOGO 语言其实承袭了 LISP 语言的伟大精神,并或多或少反映了早期人工智能大师们对“机器思维”这一本质问题的思考。我之所以学习 LOGO,多半还是因为解释器界面中央那只听话的小海龟。今天有不少在线的 LOGO 语言解释器,可以让我们重温指挥小海龟的快乐,比如在 Logo Interpreter 运行示例程序得到的图画:


不过我当年完全不知道,LOGO 语言的主创团队其实不仅编写了屏幕上虚拟的程序海龟,还设计制造了真实的、可以在纸上跑来跑去的机器海龟(1969 - The Logo Turtle),这其中就有 Marvin Minsky 的贡献。

即便用今天的标准来评价,这个机器海龟的样子仍然憨态可掬:

有点儿像星战里的 R2D2?小机器海龟的肚子里插着一只笔,可以根据指令在纸上画来画去。后来改版的小海龟机器人有一个透明的外壳,反倒不那么可爱了。

1972 年,人们甚至制造出了一台不需要拖着一根导线尾巴的无线小海龟。如今,好几个创业公司在儿童编程教育机器人的市场上激烈竞争,可我觉得今天的好多点子,其实还不如当年 LOGO 语言控制的小海龟机器人来得有趣。


既然说跨界,还是有必要回到大家公认的跨界大师 Herbert Simon 身上。有关 Herbert Simon,中国人通常都非常愿意提及他的中国缘。Herbert 早于 1972 年就到访过中国,70 多岁还在学中文,也是中科院最厉害的外籍院士之一,他还给自己起了个中文名字叫司马贺。另一件值得一提的事,是 Herbert 在卡内基·梅隆时教过一个中国学生,叫沈为民。沈为民大部分时间在南加州大学工作,研究方向主要是机器人和人工智能算法。在沈为民自己写的简历页面(Wei-Min (Weimin) Shen's Informal and Formal Bio)上,他介绍说,自己是经历过知识青年上山下乡的一代人,恢复高考后,他与 Herbert Simon 在北京第一次见面——那应该是 Herbert 某一次到中国访问的途中。


作为诺贝尔经济学奖得主、图灵奖得主、人工智能奠基人、卡内基·梅隆的象征以及诸多领域内的公认大师,Herbert Simon 在学术界的地位并不比图灵逊色。他甚至有一本传记被完整翻译成中文,在中国出版,叫《穿越歧路花园——司马贺传》(上海科技教育出版社,2009,以下未注明出处的引语均来自本书)。

据传记作者介绍,Herbert Simon 自称已掌握了 20 种语言的阅读技能,传记作者可以证实其中 7 种。除了语言能力,Herbert 还强调,每一位大学教师都应该有能力教授任何一门学科的入门课程,而他自己显然具备这种能力。对于 Herbert 这种追求通才式大学教授的理念,我是举双手赞成的(当然,我可不会奢望杨振宁去给大一的学生讲授马哲概论),但真心不知道,这世界上到底有多少比例的教授、讲师可以达到 Herbert 所要求的水平。


在 Herbert Simon 身上,还体现出通才式大师的另一个特点:擅长自学,并或多或少游离于正统教育之外。Herbert Simon 在芝加哥大学上学时,就不怎么喜欢上课,经常自己看书准备考试,且根本不用老师辅导。他对正规教育与自修之间关系的论述颇能引起我的共鸣:“大学二年级初,当一位微积分教授坚持要我上课的时候,我就终止了自己的正规数学教育。”虽然不上课,他的成绩并没受到太大影响,他只用三年就顺利毕业,而且,本科后两年,他选修和自学的其实多是研究生的课程,并在大学期间学习拳击,参与政治活动,在政治、经济、科学三者之间,Herbert Simon 用自己擅长的而不是老师强加的方式,寻找着最有效的观察和切入点。


1955 年前后,随着通用电子计算机的发展,Herbert Simon 的关注点也逐渐由政治学、经济学和心理学转移到利用计算机来研究认知科学的方向上。他极度推崇英国精神病科医生 W. Ross Ashby 所写的《大脑设计(Design for a Brain)》一书。W. Ross Ashby 在写给 Herbert Simon 的一封信中说:


“我坚信,‘组织’的原理在根本上是相同的,不管是大脑中神经细胞之组织,还是社会中人之组织,或是工厂中机器部件与工人之组织。长期以来,我一直认为,100 亿个神经细胞在大脑里协同工作的方式与 20 亿人在社会中协同工作的方式是一样的。”

我觉得,从本源上讲,Herbert Simon 之所以能在政治学、经济学、社会学、心理学、计算机科学等领域,使用类似的决策论方法,触类旁通地完成诸多开创性研究,这与他和 W. Ross Ashby 之间有关大脑设计的讨论不无关系。Herbert Simon 研究计算机编程,研究人工智能算法的根本目的,其实还是想通过理解计算机来最终认识人类社会和人类思维,这与 Marvin Minsky 在心灵和音乐之间寻求连通关系如出一辙。


通过研究计算机来理解人类——今天的人工智能科学家很少会将如此沉重的使命放在自己肩膀上。算法研究就是算法研究,何必一定与人类行为、社会进步、未来前途联系在一起?但不同历史阶段,先驱者总会有不同的追求。假如我们穿越回那个时代,即便单从计算机的角度考虑,为了建立可以媲美人类的智能机器,我们也多半会从模仿大脑结构或认知行为开始。这既是那个时代人工智能奠基者的局限,也是他们的宝贵财富。他们开创的诸多道路,有的已被证明是失败的尝试(比如符号主义学派的人工智能——当然,有人说符号主义学派只是偃旗息鼓,稍事休息,未来某年某月,还是会像人工神经网络一样卷土重来),有的则历尽波折并终成正果(建立在人工神经网络基础上的深度学习),但无论如何,Herbert Simon 等大师横跨多个学科的广博知识,以及那个时代赋予他们的社会责任感,是推动人工智能拓荒的最大动力。


码农角度,总想看看所谓的人工智能大师的编程能力到底怎么样。Herbert Simon 本人的编程能力如何,我其实也不知该从何考证起。单看他与 Allen Newell 以及 Cliff Shaw 合作发明的信息处理语言 IPL(Information Processing Language),还是相当有水准的。IPL 语言的神奇之处在于,它在超级简明的汇编风格语法中,第一次引入了与人工智能以及诸如 Python 等现代编程语言密切相关的表处理结构——著名的 LISP 语言正是在 IPL 的影响下诞生的(LISP prehistory)。


另一件与 Herbert 相关的人工智能里程碑事件,是他对计算机下棋的判断。他早在 1957 年就预测说,计算机下棋的水平可以在 10 年内超过人类。很不幸,他的预测过于乐观,直到 1997 年,IBM 的深蓝才打败了人类棋王卡斯帕罗夫。不过这丝毫不影响 Herbert Simon 的权威,想一想 AlphoGo 与李世石人机大战之前,有多少专家曾反复预言,计算机还要 10 年或更长时间才能下好围棋?再想一想那些未来学大师们,有多少人曾做出过人工智能将在 10 年、20 年或 30 年的时间内跨越奇点、统治人类的预测?无论这些预测太保守还是太激进,聪明人其实都清楚,人工智能这东西,该来的总会到来,不会因你着急而加快脚步,也不会因你焦虑而故意延缓。

从顾毓琇谈到 Marvin Minsky,从 Marvin Minsky 谈到 Herbert Simon,这大致是一篇跨越了不少界别,但同时也没什么重点的八卦科技史。如果一定要找个重点,那就是“跨界”一词:人工智能的奠基者中不乏跨界天才,而人类最后的发明——人工智能本身又何尝不是一个跨越了现实与未来的终极存在呢?

文章被以下专栏收录