首发于AI学人
计算机科学家的土豪人生:人工智能人物谱(二)

计算机科学家的土豪人生:人工智能人物谱(二)

科学家 vs. 金钱,是个值得探讨一辈子的有趣话题。现如今摆在明面上的事实是,真正有才的人工智能科学家凤毛麟角,能被 Google、Facebook、百度抢来抢去的那拨人年薪动辄几百万美金,搞得一众苦逼码农们唏嘘不已。上行下效,这年月哪怕是毫无经验的应届毕业生,也愿意给自己的简历上贴上大数据、机器学习、神经网络之类的标签,就像淋了水的蔬菜,开了光的菩提,身价即便不涨,内心也是舒畅。

实话实说,计算机科学家能赚钱的不少,与其他门类相比,计算机科学这个圈子跟热门行业离得更近,教授容易申请经费,学生容易打工养活自己,脑筋稍微活泼一点儿的就各种开公司,拉投资,卖概念,再不济,就算老老实实待在大公司里写代码,收入也高过普通办公室白领不少。

可十块钱是钱,十万亿也是钱。几百万美金的年薪有人看了眼馋心热,有人却当它是键盘噼啪一响就翻来滚去的数字游戏。所以,看钱得往高处看——这一篇,咱们接着聊人工智能领域的大牛科学家,而且,先拿金钱设个门槛儿,这门槛儿其实也不高,几十亿美金起步吧。

身价几十亿美金的计算机科学家?嗯,我们先从许多许多年前聊起。

1980 年代,李开复研究非特定语者连续语音识别的时候,有个叫 Peter Brown 的神秘人物起了不小的作用。李开复在自传里是这么说的:

“1984 年暑假即将来临,我正沉浸在自己课题的十字路口上,不知道何去何从。这个时候我遇到了我的一个师兄彼得•布朗(Peter Brown),他看到我愁眉不展,就把我叫到一间教室里,在黑板上写了几个统计学公式。彼得•布朗对我说,‘开复,我知道你在做语音识别,并且为之苦恼,但是你为什么不尝试一下统计学的方法呢,从统计中抽取数据我想应该能够提高语音识别率,你觉得呢?’”

李开复讲得简单,其实里面还有一点儿背景需要交代。

这个 Peter Brown 在人工智能领域算不得什么顶天立地的大人物,但在技术发展史的几个关键点上,都坚定地站在了代表未来方向的一面。他跟当年 CMU 毕业的许多博士生一样,进入了那个时代 科学家们最向往的几个超级乐园之一——IBM 的 T. J. Watson 研究中心。

1970 到 1980 年代,IBM 研究中心(“深蓝”的诞生地),贝尔实验室(UNIX故乡),是不是还得算上一个施乐的 PARC(苹果电脑的图形用户界面可以溯源到这里)?它们差不多就是计算机科学的三大圣殿了吧。

在 IBM 研究中心里,Peter Brown 跟着 Frederick Jelinek 领导的小组做语音识别。顺便提一句,这个 Frederick Jelinek 是写《浪潮之巅》的吴军博士的导师,是自然语言处理领域的权威人物,他的好几个学生(还有学生的学生)在 Google 工作时也跟我有过项目上的交集。

Peter Brown 这个语音识别小组要解决的是 IBM 关心的听写问题,目的是要用语音识别来代替打字机,代替字处理软件。技术上讲,那个时代的语音识别主流是做专家系统,大概属于符号语义学派(Symbolic AI),可 IBM 里的这一小撮人却悄悄搞起了概率统计模型和 HMM。个中原因说出来,就完全没有了神秘感——IBM 那拨人之所以去搞概率统计,倒不是真的因为他们预见到了未来,而是因为他们一时找不到语言学方面的专家。没想到,弄一大堆训练数据统计来统计去,效果还真比专家系统提升了不少,技术曙光初现。

李开复当时在 CMU 读博士。IBM 的语音识别是公司里的机密项目,Peter Brown 却因为师兄弟的关系,把 HMM 以及相关的几个关键词写给了李开复看。李开复问起算法细节,Peter Brown 又支支吾吾起来,一边让李开复去看他们发的 paper,一边又旁敲侧击地提醒说,“发表出来的,都是效果不好的。效果好的,我们都不发表的。”高手之间,原不用说得那么明白,就这么明着暗着一番暗示,李开复硬是顺着这条概率统计的道路走了出来,还走得更远更好,研究出了比 IBM 发布的听写系统好很多的语音识别技术,用自己的论文宣告了 Symbolic AI 在语音识别领域的完败。

鉴于 HMM 的成功,Peter Brown 和他们这个研究小组的同事们基本都拜服于统计方法的脚下。这个小组的许多人后来一直从事语音识别研究,可 Peter Brown 不是在一个领域一耗若干年的那种人。这个组里还有另一个不安分的人,他的名字后来经常与 Peter Brown 并列,他叫 Robert Mercer,通常人们也叫他 Bob Mercer。

Bob 比 Peter 年长,1972 年就加入了 IBM 研究中心。Bob 和 Peter 玩腻了语音识别,就开始去弄机器翻译。反正是人工智能领域的几大难题之一。

这一下,还真捅了马蜂窝。要知道,语音识别和机器翻译在经典人工智能科学家的心里,地位是有天壤之别的。

语音识别嘛,不就是听见啥输出啥,一个听写机器而已。符号语言学的方法在语音识别上派不上用场,统计学方法大放异彩,那完全是因为问题本身就不属于高级智能的范畴。

机器翻译?那可是要理解原文语法、语义,然后转换成目标语言的语法、语义的。论智能程度,语音识别是两三岁孩子的水平,跨语种翻译?那可是许多翻译大家皓首穷经,一辈子也难以企及的高远境界。钱钟书不是提到过么,“十七世纪一个英国人赞美这种造诣高的翻译,比为原作的‘投胎转世’(the transmigration of souls),躯体换了一个,而精魂依然故我。”厉害吧,“投胎转世”耶,这玩意儿绝对算得上是高级智能,是人类智慧的精华,要用计算机来解决翻译问题,非得懂得人类思想方法,懂得语言学不可。

Bob 和 Peter 这两个浑身码农味道的研究员,居然要用什么概率统计方法来解决机器翻译问题,这真真要被语言学家们笑掉大牙的。

这故事的结局大家肯定猜得到,Bob 和 Peter 带领的机器翻译小组只用了很短的时间,就建立了一套可以运行的,基于大语料统计模型的机器翻译系统,居然得到了不算太糟的结果,至少,那结果比经典语言学方法得到的结果更接近人类语言,更让用户信服。从那以后,成功的机器翻译系统比如 Google Translate 走的都是统计模型的道路(今天更是在统计模型的基础上增加了深度学习这个高级武器)。Bob 和 Peter 的工作并不复杂,但他们在机器翻译领域的贡献直到许多年后还有人记得。2014 年,计算语言学会议给 Bob 颁发了终身成就奖。

Bob 比 Peter 从事研究的时间长些,论文也比 Peter 多些。两个人都在语音识别和机器翻译这两个领域取得了不俗的成就,算得上人工智能发展史上的重要人物吧。功成名就之后,大概可以考虑在大公司带带团队,在高等院校指导指导学生,没事儿就去申请申请科研经费的所谓“后半生”了。

别人的人生到达顶峰,Bob 和 Peter 的人生才刚开始。他们的人生目标不是赚一个亿,而是赚十个亿,一百个亿,甚至更多——而且,是运用计算机科学的方法,借助计算机科学家特有的敏锐头脑和人工智能知识。

有一家高科技公司,在熟悉投资和基金的人听来如雷贯耳,在普通码农听来,却多半是丈二和尚摸不着头脑。这家公司叫文艺复兴科技(Renaissance Technologies)。

文艺复兴科技?听起来像什么公司?前半部分像搞艺术的,后半部分像搞电脑的,合起来像搞诈骗的?其实,理工科学生和码农们现在关心投资理财的越来越多,像我这种每次看见著名基金公司名字就彻底蒙圈的人,还是在逐年减少的(回头有空了必须做一个“为什么著名基金公司的名字都比较无厘头”的无厘头研究)。认真地说,这公司是家特别特别特别著名的用量化交易赚钱的对冲基金公司。

文艺复兴科技的创始人 James Simons 老先生本身就是个很牛的数学家,还是个很有黑客精神的密码学家(据说攻破过美国政府的密码系统),此外,他还立志用数学模型来赚钱——可谓既有科学情怀、极客情怀,又有财富情怀。当然,寻常老百姓看不懂他在数学领域做了啥,也没法知道他究竟破解了哪些密码,大众只知道他经常在福布斯富豪榜上排在前 100 名里。至于他到底有几百亿的身家,网上有不少数据,有没有水分不好说,反正他每年至少入账一二十亿,媒体对他的一致评价是“世界上最聪明的亿万富翁”。

“最聪明”,“亿万富翁”,哎呀,人生能同时得到这两个标签,该是何等的幸福?偏偏造化弄人,这世上有多少聪明人穷困潦倒,又有多少亿万富翁智商低下?

James Simons 之所以能赚那么多钱,主要是文艺复兴科技的几只基金,特别是一只叫大奖章基金的,表现超乎寻常,年均回报高达 71.8%,难怪这基金连管理费和业绩分成都比同行高出一倍还多。James Simons 把基金成功的主要原因归结为数学魔术。当然,大奖章基金到底是如何建模的,外人大多只能猜测些皮毛,真正的魔术技法,文艺复兴科技才不会随便透露。即便最近几年外界对文艺复兴科技的质疑声渐多(特别是大奖章基金以外的几只基金表现不佳),大奖章基金依然在最牛基金排行榜的前列屹立不倒。姑且认为,基于机器学习的人工智能技术就是这一类顶级基金公司的印钞机好了。

据说,James Simons 招人的条件颇为严格,一定要找最聪明的数学家或计算机科学家,坚决不找学金融的、学工商管理的。文艺复兴科技的公司内部,基本上就是一个极客乐园,一点儿也没有华尔街那些世俗金融企业的影子。1993 年,Bob Mercer 和 Peter Brown 这两个在人工智能领域已经颇有名气的研究员被 James Simons 招至麾下,开始和文艺复兴科技里的数学家、计算机科学家一道,用人工智能技术投资理财,走上了光芒万丈的财富之路。

2009 年, James Simons 退休,Bob Mercer 和 Peter Brown 出任文艺复兴科技的 co-CEO,正式成为财富巨轮的领航人——这么说显得不那么功利,其实,作为这家神奇公司的 CEO,他们自己也早就变成亿万富翁了。福布斯的估计是他们每人每年都能净入一亿美金以上。

从大学校园和 IBM 研究中心走出来的计算机科学家领导一家基金公司,这件事在华尔街不算新鲜,但在不熟悉金融圈、投资圈的码农们看来,确实有些不可思议。科学家和财富之间,什么样的关系才最和谐?

就个人爱好、性格、生活来说,Bob Mercer 和 Peter Brown 也都算得上是神人级的存在。而且,他们俩的性格还大不一样。

Peter Brown 爱动,话唠,好胜,据说喜欢在公司健身房跟员工角力,也花了不少精力将财富投到慈善事业里。

Bob Mercer 就不大一样,他自己说自己喜欢孤独,宁愿不跟人说话。可另一方面,Bob Mercer 又是个著名的政治活动参与者,参与的方法很简单——大把大把地捐钱。从 2012 年总统竞选,到今年的 Trump 对 Hillary,Bob Mercer 以个人或家族名义,几百万几百万地捐出政治献金。他女儿 Rebekah 更是直接站在前台支持 Trump,参与竞选团队的事务和决策。

其他方面,诸如 Bob Mercer 和女儿都是德州扑克高手,Bob Mercer 拥有多少多少游艇,业余时间爱玩一套几百万美元的铁路模型之类,只能算是亿万富翁的日常生活一隅,实在不足以成为多么了不起的谈资。

从人工智能科学家八到大把大把的金钱,从金钱八到科学家的研究、项目、事业、生活,不是说科学家一定要跟钱死磕,也不是说没钱就配不上科学家的金字招牌,只是想小声说一句,这世上最多的钱最好还是让最聪明的人赚到,那总要比人傻钱多的世界来得舒心、愉快。

下一篇,我们换个没那么多钱的科学家来八八。

(注:本文部分内容,李开复博士亦有贡献)

发布于 2016-09-20 12:57