《我看见的世界》作者:李飞飞
上一节我们讲到李飞飞的努力终于有了回报,她以全额奖学金被名校普林斯顿大学录取,到美国后第一次找回了自信和尊严。读书期间,家里突遇困境,幸得恩师萨贝拉先生一家地尽心帮助,得以度过了一个又一个难关,让生活重归了正轨。
那么,在这一节中,让我们回归李飞飞的求学之路,看看她后来从事的研究领域,是怎样一步步确定下来的?
寻找自己的北极星
李飞飞的大学生活和大多数美国学生不同,一是她每周都要回家帮忙打理干洗店,二来,她的个性依然保守,喜欢独来独往,除了学习,很少参与其他事情,她从来没有加入过学校著名的美食俱乐部,也不参与学生之间的社交派对,她把每天的学习日程都排得满满当当,不是去上课,就是参加各种学术讲座和研讨会,还从图书馆借阅成堆的书,让自己沉浸在数学和物理学浩瀚的知识海洋中。
每个周五的下午,李飞飞都会参加高等研究院员工下午茶,这个活动不是闭门研讨会,在这里,她常常能遇到一些研究生,可以和他们讨论学术,这里出入的很多教授,都是物理学先驱或者一些前沿理论的研究者,能够近距离接触这些大师巨匠,亲耳聆听他们谈话的片段,在伟大的思想中漫游,让李飞飞感到无比满足。
随着学习的深入,李飞飞意识到,计算机不仅仅是用来写论文或者访问早期互联网的工具那么简单,还能帮我们解码思维的本质,建立思维模型。随着人类的智能被机器不断地映射、解构甚至模拟,计算机模型可以体现出一些人类的智慧,于是,李飞飞报名参加了计算机课程C语言。而随着对计算机科学的深入学习,她就像打开了一扇通往新世界的大门。
那年夏天,加州大学伯克利分校开展一项实验,涉及神经科学、生物学和视觉工作的原理,他们需要一个没有太多相关经验的本科生,李飞飞兴奋地报名参加了这个长达八周的实验,在教授、博士后们的指导下,从零开始搭建实验仪器,组装设备,研究哺乳动物视觉皮质的开创性工作,在猫的眼前投射图像,然后分析猫的神经元反应。
等实验结束回到普林斯顿大学时,李飞飞觉得自己已经脱胎换骨。之前,她一直痴迷于物理学,而现在,她开始意识到,物理学真正的魅力,不在于概念或者方程式,而在于对于其象征意义的探索和追逐,她很清楚,自己热爱研究,对新的发现充满热情。
在科学界,每一位科学家都会追寻自己的北极星,也许是一个问题,一个假设,甚至一个赌注。这种狂热的追求,是他们生而为人的定义。年轻的李飞飞想,在浩瀚的天宇中,她也要追寻属于自己的北极星,即使追到天涯海角,也毫不犹豫。
转眼已是1999年,李飞飞即将大学毕业,再次面临科学抱负和现实生活之间的抉择。当时,网络经济正在蓬勃发展,有数学背景和名校学历的人很受金融界青睐,即便是李飞飞这样学习物理学的,也受到了华尔街的大力招揽,不少像高盛、美林这样的名企向她抛出了橄榄枝,他们提供令人艳羡的起薪、福利、晋升机会,还有真正的医疗保险,甚至承诺帮李飞飞一家承担债务,结束干洗店日复一日劳累的生活,为她的家庭提供经济保障。
这何尝不是李飞飞所渴望的,但是开启职业生涯,就意味着放弃科学追求,该怎么抉择呢?
李飞飞斟酌了好几天,终于在干洗店的片刻闲暇中,对母亲提起了这事。当时,母亲正坐在缝纫机前,嘴里咬着别针,专注地检查着手里的衣物;而李飞飞在旁边打下手,正给一条客人要加长的裤子拆线。
李飞飞说:“妈妈,我面试了几家公司,都是华尔街巨头,他们给的条件很吸引人。”
“华尔街巨头?”母亲问,她对这些美国文化术语并不熟悉。
李飞飞解释道:“就是搞投资,做股票、交易什么的。当然,有很多东西要学。不过我如果真下定决心,还是学得会的。”
母亲平淡地说:“这是你想要的吗?”
李飞飞回答说:“可是妈妈,这些薪水足以改变我们的生活了,而且……”
母亲打断了她的话,又问了一遍:“飞飞,这是你想要的吗?”
“妈妈,”李飞飞说,“你知道我想要什么,我想成为一名科学家。”
“那还有什么好说的呢?”母亲淡然地回应道。
母亲的话一针见血,速度快得让李飞飞需要点时间才能反应过来。最终,她确定了心意,要去读研究生了。
迈入视觉研究领域
那次在加州大学伯克利分校的实验经历,让李飞飞看到了智能的奥秘,也认识到,解开智能之谜的关键,是深入理解“视觉”。当时,在视觉研究领域,有两个方向,一是神经科学,二是计算科学。神经科学可以更深入地了解大脑的能力,而计算科学可以利用工程学的原理建模,甚至有复制智能的能力。
李飞飞决定两者兼修,她选择去加州理工学院深造,这是一座位于南加州,阳光明媚、鲜花盛开、气候干爽的世外桃源般的学校。
在两位导师带领下,李飞飞一步步展开了她在视觉研究领域的探索。
人类的视觉能力进化范围广,演化过程复杂,有没有可能把人类的视觉能力采用自动化复制给计算机呢,计算机能够共享人类对世界的感知吗?
从人工智能发展早期开始,研究人员就一直在探索这种可能性,不过,他们很快便意识到,这是个巨大的挑战。
首先,难在数据本身。比如,一张图片,人类看到的是颜色和图案,而对计算机而言,则是一长串数字编码,因为数字图像是以像素的形式存储的。要想让计算机的算法像人类一样去理解图像,就要先用某种方式去定义这种数字模式。
其次,人类看到事物之后,除了单纯的“看见”,还会形成深层次的“理解”,从被动的感官输入到主动的认知,是人类大脑最了不起的一项能力,该怎么把这种能力复制到计算机上呢?
在研究生第二学年即将结束时,李飞飞已经阅读了大量文献,参加了各种研讨会和专题会,参与了许多实验,她认识到一个重要的事实:视觉和知觉依赖于分类。也就是说,人类的大脑会自然而然地把看到的细节进行归类。
举个例子:蓝色天空下有一棵绿色的树,对于这幅场景,我们所看到的,不仅仅是简单的蓝色和绿色图案,而是会把这些图案进行归类,蓝色的是天空,绿色的是大树。
基于这样的发现,李飞飞开始越来越确信,解开人工智能之谜的第一步,就是要让计算机通过理解各种物体来理解视觉世界,而要想理解各种物体,需要先把事物进行分类,然后再让算法充分接触视觉世界里丰富繁杂的事物,从而具备识别能力。
导师支持李飞飞的想法,也认为在人工智能的视觉领域,数据是真正的主角。为此,他们决定创建一个大规模的数据集。之所以说是大规模,因为加州理工学院有史以来最大的数据集,只包含了7个随机选择的类别。导师建议,这次要搞100个分类。
要知道,这可是个大工程,工作量相当大,创建100个分类的图片,需要在每个类别中包含各种各样的例子,至少需要几个月夜以继日地筹备,用李飞飞的话说——这比她这辈子做过的任何事情都要费力,可是,这恰恰是她想要的,她觉得,自己所追寻的那颗北极星,已经开始在地平线上遥遥闪烁。
建立完整的数据集是个耗时缓慢,甚至无聊乏味的过程,李飞飞和她的同伴们花了几个月时间,手动查询图像搜索引擎,挑选好的图片,然后下载,裁剪调整图片的尺寸,再打上标签进行标注,放进不同的分类,比如,手风琴、搅拌机、手机、龙虾、披萨、雨伞,等等。
到了2004年,浩大的工程终于完工了,导师说要100个分类,李飞飞就给他做了101个。这个图像集成为有史以来为机器学习所创建的,最大规模的图像集合。在101个类别中,包括9000多张图像,被官方命名为“加州理工学院101类图像数据集”。
计算机算法学习了这个数据集后,性能显著提升,李飞飞团队随即发表了关于机器学习的论文,在接下来的六个月中,世界各地的研究人员都把这篇论文作为标准,这让团队深感振奋。
加州理工学院为李飞飞后来的事业发展奠定了良好的开端,也带给她另外一种幸运:她在这色彩斑斓的美丽校园里,遇到了自己的爱人,一个身材高大的意大利人,名叫西尔维奥,是李飞飞的研究生同学,两人经导师介绍认识,因为同样痴迷学术,走到了一起。后来成为一生的伴侣。
这个时期的李飞飞,还只是一名学生,就已在业界崭露头角,那么从加州理工学院毕业之后,她又选择了怎样的职业道路,怎样的学术方向,最终一步步攀上行业顶峰的呢?除了事业之外,她的个人生活怎么样,父母、师长都还好吗?故事仍在继续,让我们下节继续。