远东轶事
首发于远东轶事

2015年末总结

2014年年底的时候,我辞了在谷歌无人车组的工作,和老婆开车穿越死谷,看着白茫茫的盐海,一望无垠。

无人车的前景确实广阔,要是能做成,那对整个世界将是革命性的。犹记得2013年年底,我还写过一篇推广无人车的文章,介绍它不同于学术界的工程思路。当时的我,觉得这很新鲜很有趣,但是时间一长,狐狸尾巴就露出来了。思维方式的不同,决定了我还是必须去追求自己的方向。与其在泱泱大河中做一滴水,还是不如当西部牛仔在沙漠中闯出一条自己的路。老婆说“这工作多少人羡慕,为什么还要换?”,老妈说“换工作钱少了,将来我们靠什么养,有病怎么治?”——我当时听了,潸然泪下。

但男人,得要为自己的选择负责。对别人负责,更要对自己负责。

2013年年底,我在ICCV上的文章获得了马尔奖提名,给我很大的信心。这篇做理论分析非凸问题下全局最优解样本复杂度的文章,其实验效果也不错。那时正是深度学习开始大火的时候,自然而然,我就想试着做下深度学习的理论,因为那个也是非凸问题。2014年我还在无人车组,同事们都在写code过review修bug过测试,没有人在意会议和文章,因为一切都是保密的。只有我自己业余时间在家里单干,打算投2014年的NIPS。最后期限前一周,我每个中午都消失不见,不参加组里的午饭,腾出一小时来改业余时间自己折腾的文章。最后一天,最后一小时,文章都改得差不多,帐号都已经注册好了等着投稿,我让老婆随便读一读,她出于好奇提了一个问题,我想了想,说回答不了,于是撤稿。

那天晚上,我非常沮丧,但是越是沮丧,越想着要往前走。这种冲动,可以是大海中的明灯,也可以是永不消逝的诅咒,究竟是哪个,全要看能力、大势和运气。我当时觉得出不了理论成果的原因,是不能全职做,但真去Facebook全职做了,每天折腾,仍然出不了。2015年的前半年,花一半的工作时间继续从事理论,又写掉一本草稿本, 但仍然只是个半成品,2015年6月的NIPS还是没有投成。毕竟小规模的理论可以做,但是要再上一层,就千难万难,更进一步,要让深度学习的理论像物理学那样能和现实情况完全对上号,那几乎是不可能的任务。为了让理论能得出有意思的结果,不得不发明一套自己的假设,而实际情况并不是这样。结果是,要么活在简单完美的理想国,要么就活在真实复杂的现实世界。对于一个从心底里认为“世界是有规律”的人而言,强迫自己闷头只调参数很困难,然而眼见深度学习的大潮汹涌而至,可做的应用茫茫一眼望不到头,每个月在arXiv上都有新成果,在这种情况下,罔顾整个研究界作出的努力,去花几年为自己想像出来的模型做理论,合适么?

不能再这样下去了。于是时隔两年以后, 我在2015年七月底做出了这个妥协:先做应用,有了好的应用,再回头去做理论,只有那些效果非常好并且相对简单的模型,才值得去思考对应的理论。脱开效果去设计模型,可能走了十万条看起来很美的道路,但没有什么能称得上是真正的进展——扪心自问,现在都已经博士毕业了,我还愿不愿意花时间去写那些明知不好用的文章呢?

想清楚这一点,脱下身上的枷锁,下半年的狂奔就开始了。与做理论相比,做应用的好处是目标明确易于管理,花时间下去必有所成。只要一直处于精力集中的状态一两个月,没有进展才是不正常的,更何况一周工作六七天,一天十多小时的强度了。

结果大家都看到了。各种报道都有了,先是图像问答系统,更火的是智能围棋系统,在Wired(这里这里),MIT Tech Review华尔街时报上都登了(新浪翻译并转载了)。这两个系统都能拿出去给别人使用,都是目前人工智能各自领域数一数二的水准 。一年前我还在愁申请绿卡所需要的媒体报道不够,现在与之相比真有天壤之别。与谷歌的低调保密不同,Facebook是追着要报道,要新闻,毕竟它是个社交媒体公司,只要是吸引眼球的东西都会喜欢。这点对研究员来说是好是坏,不得而知,你可以批评它太过浮躁,也可以赞赏它的快速行动力,或者暗爽自己的工作被人关注。在微软研究院都得被逼去做产品的现在,“急功近利”未必是坏事,而“十年磨一剑”也未必是好事,这是个只看成果的世界,知道什么办法有效,并实践之,然后等着几个月效果出来后帮你说话。至于那些语文课上学的成语,都是被人当成标签,事后再给成功者或者失败者们贴的。

我有时候会问自己:“我是不是背弃了梦想?”我想除了我自己,任何人都不会给我答案,任何评论也不具效力。我记得有人问过,如果梦想从践行的一开始,就在不自觉地向现实妥协,那样的梦想还是最初的梦想么?其实,这样的问题没什么可纠结的,因为世界从来就不是二元的,梦想和现实,如同高悬的日月,日月之间,有一条灰色的路,在自己脚下蜿蜒曲折,绕过各种险阻,一直向前。

而我能做的,只是要在奔跑时,不停提醒自己,还记得“梦想”这个词的含义。

编辑于 2016-01-03

文章被以下专栏收录