从洗衣妹到人工智能首席科学家,这个华裔女孩究竟如何逆袭!

从洗衣妹到人工智能首席科学家,这个华裔女孩究竟如何逆袭!


随着人工智能的崛起,一个叫ImageNET视觉识别的挑战赛(ILSVRC)在近几年里备受瞩目。

这个挑战赛要求参赛团队使用ImageNet——全球最大的图像识别数据库,测试他们系统的运行情况。



图:ILSVRC

而这个计算机视觉领域的“奥赛”,也一直吸引着该领域的顶级研究机构(包括微软、谷歌、百度等)为之争得头破血流。


在2015年,百度还涉嫌在测试过程中作弊,被ImageNet挑战赛提出禁赛一年。




而提起ImageNet,就不得不说它的背后的缔造者——李飞飞。


她不但是这场挑战赛背后的“美女考官”,还是ImageNet这个全球最大图像识别数据库的主创者。



图;李飞飞


李飞飞,这三个字几乎是AI(人工智能)界无人不晓的名字。



她不仅是斯坦福AI实验室主任,还是斯坦福大学的终身教授。

在顶级期刊上,她的高质量文章就有100篇以上,引用量更是高达33215-44773次。



2015年入选“世界百大思想者”,2016年她还被美国评为“年度杰出移民”之一,以前获此殊荣的还有爱因斯坦、基辛格等




前一阵子,谷歌宣布李飞飞成为谷歌云计算首席科学家,也在业界更是引起了不少轰动。


此前,李飞飞一直都专注于实验室,与业界联系不深。

她现在走出实验室的举动,让许多人都对人工智能的发展了充满信心。




然而,这位站在金字塔顶端的女科学家背后,却有着一段鲜为人知的励志人生。

早年的她竟然还有过清洁工、中餐馆收银员、帮人遛狗、开干洗店等工作经验。


...



1976年出生的李飞飞在四川长大。

16岁时,她便随父母远渡重洋来到充满希望的美国,落户在新泽西洲的Parsippany小镇。



但李飞飞并不是富二代,父母都是清贫的知识分子。

初到美国,对英语一窍不通更是全家最大的阻力。

光是择校问题,她就奔波了好几个月,费了九牛二虎之力才得以在当地一所排名中游的学校上学。




图:李飞飞一家

那时,爸爸去帮别人修相机,妈妈就去当收银员。

但这类工作的收入,完全不足维持生活和支付她的学费。


所以到美国后的很长一段时间,李飞飞生活的关键词就是“谋生”二字。

在唐人街附近的很多零工,包括收银员、清洁工、服务生等她都做过。



图;高中时期的李飞飞


然而在打工之余,李飞飞却还要应对两年后的美国大学入学。


作为新一代移民学子,她不但要迅速掌握英语,还要拿出一份极其优秀的成绩单,才能考上好的大学。


那时候,打工和学习几乎占满了她的全部生活。

最辛苦时,一天只睡不到4个小时。



图:1995年,Parsippany镇上关于李飞飞的报道


只要你想,全世界都会为你让路。

凭着这股毅力,这位华裔少女收到了普林斯顿大学计算机系的offer,还是提供全额奖学金的那种。


当时这个消息在小镇上算是个大新闻,还有报纸专门刊登了她奋斗的故事,称她的“美国梦”成真啦!



图:李飞飞在普林斯顿大学


在普林斯顿大学她接触到了大量优秀的人才,这对她而言更是莫大的鼓舞。



然而,在大学她依然不改拼命三郎的性格。

看着父母还是做着入不敷出的零工,李飞飞决意借钱买下了一家洗衣店,交给父母经营。


从此,她也就过上了周一到周五在普林斯顿拼命学习,周六日则赶回家中,继续当洗衣妹的日子。




她不但独立,浑身上下更是散发着对生活的热爱。


“我爱普林斯顿,也非常爱我的洗衣店”

“我觉得辛苦不算什么,因为我父母也同样在努力工作。我们一家人只是为了好好地生活。”




1999年,李飞飞从普林斯顿大学毕业。

然而,那时的她却拒绝了多家金融公司的工作邀请。


在父母的支持下,开始追随自己的内心,毅然踏上一年的西藏之路研究藏医。




图:李飞飞在西藏的日子


完成了这一梦想后,她再次拒绝了华尔街的高薪工作,开始了下一个梦想——读博士。



然而,在读博期间,她的母亲却不幸得了癌症,之后又中风。

生活的重担几乎压得她喘不过气来。





“人生最难的不就是,如何发挥自己最大的潜能,同时兼顾自己所身负的责任,然后又必须忠于自己的内心吗?”


而李飞飞用自己的行动告诉我们,她做到了!



...



在博士毕业后,她进入了斯坦福大学AI实验室,选择了当时不被看好的研究方向——计算机视觉识别领域。


通俗的说,就是拿一张图片,让计算机认出来这张图片所包含的内容。

比如,你告诉计算机,“猫”是由圆脸、胖身子、两只尖耳朵和一条长尾巴组成的东西。



然而在现实生活中,猫就有成千上万个品种,就算是同一只猫,也能摆出上百种姿势。

如果遇到一些骨骼清奇的猫,换个姿势计算机估计就懵逼了。




那个时候,图像识别已经走过了20个年头。

但全世界能够识别的物体也不过4到20种。


然而大千世界这么多的物品,如果计算机只能识别豹子、飞机、人脸和汽车这几样是远远不够的。



面对图像识别如此匮乏的“词汇量”,李飞飞产生了一个疯狂的想法。

她拿出一本字典,决定要让图像识别涵盖到字典里的每一个词条。




图:李飞飞与导师


当她把这个想法告诉其他教授时,大家都纷纷劝她换个方向,因为研究这个是“拿不到终生教授”的。


她还找了好几个教授想要寻求合作,也全然被拒绝了,都认为“看不到结果”,“不值得”。


但是李飞飞却没有想那么多,先别管“终生教授”的事,首先要做好自己认为重要的事情。




图:李飞飞在斯坦福大学授课


刚开始时,李飞飞将很大部分的精力都放在算法的优化上,然而这并没有带来太大的突破。

突然有一天,一个非常简单但却非常有冲击力的想法,使李飞飞找准了方法。



她想,没人教婴儿怎么“看”,也没有人告诉他们“猫”的特征。

但是他们却能够很快的知道这就是猫,无论什么品种或什么形态。




因为人类的眼睛就好像一个生物照相机,每200毫秒就能获取一幅图片。

一个三岁的孩子就已经见过上亿副图片了,能分辨图片当然不在话下。



所以要让计算机学会“识图”,关键是在于训练量——让计算机看更多的图片。





从2007起,李飞飞与团队便从互联网上下载了近10亿幅图片。


在这之后便是对这些图片进行分类、打上标签,为计算机提供学习用的“题库”,而这个“题库”就是现在的ImageNet。



然而,当他们给图片打标签打了几个月后,研究经费很快用完了。

而且按照这个速度,至少得十几年才能完成目标,因为图片实在是太多了。



但李飞飞却从来没想过放弃,在最困难时,她甚至还想重操旧业开洗衣店,为研究筹集经费呢。




正当大家一筹莫展时,他们遇到了美国最大电商平台——亚马逊。

当然不是在上面买书,而是和亚马逊的众包平台合作。



通过众包平台,李飞飞在网上雇佣到了来自167个国家5万人,为这十亿张备选图片筛选、排序、打标签。

当时的李飞飞,一度是这个众包平台上最大雇主。




到2009年,ImageNet数据库就包含了1500万张照片,涵盖了20000多种物品。

回想在2006年那4到20种物品,ImageNet数据库无论在质量还是数量上,都是空前的。


然而,最重要的是,ImageNet这个如此庞大的图片数据库竟然是免费的。

这就意味着,全球所有致力于计算机视觉识别的团队,都能从这个题库里面拿“试题”,来测试自家算法的准确率。



图:ImageNet挑战赛的机器错误率, 七年来从28%降到了3.6% ,比人眼识别的错误率5.1%还要低。


为了激发各界对计算机视觉研究的热情,李飞飞每年都会举行一场ImageNet视觉识别挑战赛。


在这场考试中,无论挑战者的输与赢都代表着一次新的发展。


如果考生能轻易答对“试题”,这就说明了视觉识别技术的更上一层楼。

但如果“试题”难倒了考生,也不用担心,这也意味着算法的突破口就在这。




不过,对于现在一度“过热”的人工智能,李飞飞也一直在强调“人工智能现在越火,越需要有冷静做研究的人”


她说“我做研究的心得就是,眼睛看到的前方应该是比较空旷的。如果你眼睛看到的前方是热闹的,那这个方向就不是最好的研究方向。而空旷的地方一般都不是热点,因此你必须找准自己的焦点”




图:李飞飞首度亮相谷歌云大会


关于未来的AI开发,李飞飞认为不但要在学术上还要结合工业上的开发。


因为AI的最终目的就是服务于人类,这也是李飞飞加入谷歌的原因。

为的就是拉近AI与人类日常生活的距离,使AI"更接地气"。



图:谷歌街景搜集的车辆数据


在今年2月末,李飞飞又发表了最新的论文:《用深度学习和谷歌街景估算美国人口结构》。


文章主要论述了如何将谷歌街景搜集来的机动车辆数据,结合机器学习算法。

从而估算出本地区人口的特征和组成,甚至这一地区居民的政治倾向。




在李飞飞看来,目前的图像识别和人工智能,还相当于一个牙牙学语的3岁孩童。

而3岁到10岁的过程,才是人工智能的难点和关键。


就算李飞飞说图像识别的路还有很远,但也完全不妨碍我们畅想未来。




去超市买东西,直接“刷脸”付款;

在追击违法分子上,可能罪犯刚一上街就已经被一双神秘的眼睛锁定;





图gif:完全不用看红绿灯的“未来式过马路”

在未来交通上,人们不用自己抓方向盘,也有“老司机”带你飞;

在医疗上,医生和护士会多了一双永远不用休息的眼睛,帮忙诊断和照顾病人;




在TED演讲的结尾,李飞飞表示:

她现在所有的追求,就是赋予计算机视觉智能, 并为Leo(她的儿子)和这个世界, 创造出更美好的未来。


这个集才华与美貌于一身的女子,能把人类带到哪个未知领域,我们也翘首以待。

编辑于 2017-03-22

文章被以下专栏收录