中国原始科技创新

  您的位置:主页 > 科技创新 > 因为她,让机器具备像人一样“看”的能力,历史上第一次变成现实

因为她,让机器具备像人一样“看”的能力,历史上第一次变成现实

作者:看天下实验室发布日期:2024-04-11浏览次数: 来源:看天下实验室

导读:

因为她,让机器具备像人一样“看”的能力,历史上第一次变成现实 

AI领域,华人也发挥着巨大影响力。224日,芯片巨头英伟达宣布成立一个新研究部门——通用具身智能体研究实验室。该实验室的领导者是两位华人90后博士——范麟熙(Jim Fan)和朱玉可(Yuke Zhu)。

而这两人的导师,则更为重要——被称为“AI教母的华人科学家李飞飞。

 

为了赚钱,李飞飞在饭店刷过盘子,在干洗店打过工,整个高中和大学时代,她的衣服都是从别人丢掉的垃圾中捡的。

没人想到,这样一个贫穷的女孩,之后会成为席卷全球的AI革命的核心人物之一,甚至被誉为“AI教母

她的征途是星辰和大海,起点却是美国东北部的臭水沟。

16岁时,李飞飞和父母移民到美国,生活跌入谷底:一家三口挤在一个只有一间卧室的公寓里,没有积蓄,不会说英语,靠繁重的体力劳动维持生计。

这个聪明的女孩考上美国最顶尖的高校之一,却没想着毕业后挣大钱实现阶层跃迁,而是投入到当时还是天坑的人工智能专业中,梦想着教会机器学习,改变整个世界。

坚信数据对人工智能有重要意义的她,在只有一个助手的条件下,创建了人类历史上规模最大的标注数据集,为接下来引爆AI革命的大事件准备了舞台。

李飞飞一路走来,生在北京,长于四川,又从中国到美国,由物理专业到人工智能领域,靠着其坚强、疯狂与热爱,从一个洗衣妹跨进AI这场科技革命的中心。

 

1

我把你教得太好了

48岁的李飞飞在传记中直言,父母的性格各自有一部分对她产生影响。

1976年,李飞飞出生在一个知识分子家庭。父亲是工程师,性格天真散漫。李飞飞出生那天,父亲姗姗来迟,并不是因为路上堵车或其他意外,而是因为他一时兴起,跑到公园观鸟,忘了时间。给女儿起名飞飞,也是观鸟时想的。

这种好奇心传染给了李飞飞,小时候,父亲常带她到公园观鸟,去田里看水牛或捕捉昆虫,激发了她对周围世界强烈的探索欲望。

母亲完全相反,对科学不感兴趣,但热爱文学,会带着女儿读鲁迅的作品以及波伏娃《第二性》、海明威《老人与海》等西方经典。

父母的共同特点是,他们对功名利禄完全不感兴趣,也从未像很多同事那样通过送礼或请客吃饭的方式讨好上级。

李飞飞记得,小学有一次校运动会,老师要求所有人穿白色衬衫,李飞飞爸爸在仔细阅读规则后,把女儿白衬衫上每个纽扣都换成彩虹色,运动会当天,在一片白色海洋中,李飞飞尤为显眼。

父母的教育理念和学校也有冲突。因为在期末考试前还痴迷于阅读米兰·昆德拉的《不能承受的生命之轻》,李飞飞被叫了家长。母亲听完了老师的抱怨,但没有责怪女儿。

我把你教得太好了。回家路上,她对李飞飞说。

和母亲期望的不同,李飞飞最爱的不是文学,而是数学。中学接触到物理后,这又成了她最痴迷的科目,连骑自行车转弯时都思考加速度和角动量的变化。她还对物理学历史上一个又一个伟大人物感兴趣,对阿基米德洗澡时发现浮力定律、牛顿在瘟疫肆虐时躲在家乡写《自然哲学的数学原理》等事件浮想联翩。

这样的日子在李飞飞16岁时戛然而止。1992年,李飞飞父亲在美国工作3年后,将她和母亲接到美国。当时,李飞飞可能想不到,她们家的生活将很快跌入谷底。

 

2

浪费的彩票

因为完全不懂英语,李飞飞父亲没能继续工程师生涯,他在一家华人开的店找到维修相机的工作,每天很晚才下班。母亲在商店找到一份收银员的工作,做重复和机械性的操作,远离了她热爱的文学作品。

日子很难捱。李飞飞的新家位于美国东北部富裕的新泽西州,一家三口挤在只有一间卧室的公寓里,家具是从路边遗弃的垃圾里捡的。

为了补贴家用,每一个不上学的日子,李飞飞都会去打零工,最常见的工作是去中餐馆打杂,每天从上午11点工作到晚上11点,总共12个小时,时薪2美元。她也做过帮人看家或遛狗的工作,时薪更高,也更清闲,但不好找。

在餐馆打杂时,趁着下午换班,李飞飞会利用难得的空隙去读母亲分享给她的文学名著,餐馆经理对此不屑一顾。他觉得对我们这样的人来说,想象力在生活中是多余的,李飞飞回忆称。

对这些连英语都不会说的华裔移民来说,阶层跃迁是个遥不可及的梦。

曾经引以为傲的学业也变成负担。李飞飞几乎不会说英语,每一节课,无论什么科目,对她而言都是英语课。每天回家做作业,她都要准备两本词典,一本英译中,一本中译英,否则就写不了作业。

自我表达成了一种奢望,不会说话的李飞飞交不到朋友,成绩也一落千丈——考试的时候,很多时候她连题目都看不懂。

幸运的是,数学和物理两门课受到的影响很小。学习它们,更多依赖数字、符号和公式。李飞飞对数学和物理的狂热也没有随着移民到美国而改变。

李飞飞家没钱付学费,3年后高中毕业时,她申请的都是公立和社区大学,只是怀着一种仪式感,顺带申请了美国顶级名校普林斯顿——李飞飞最崇拜的科学家是爱因斯坦,普林斯顿是他度过晚年的地方。

没想到,普林斯顿不愿意错过这个SAT(类似美国高考)数学考了满分的女孩,给她开出全额奖学金。

整个社区沸腾了。邻居们羡慕地设想,李飞飞会去读普林斯顿医学、工程或者金融相关专业,拿到富裕阶层的敲门砖,改变整个家庭的命运。但是,让他们大跌眼镜,李飞飞并没有进那些热门的赚钱行业,而是选择了自己痴迷的物理。

真是张好彩票,可惜浪费了。邻居们无法理解。

 

3

两个世界

普林斯顿大学对李飞飞来说就是天堂。

因为她,让机器具备像人一样“看”的能力,历史上第一次变成现实 

普林斯顿大学校园(视觉中国 图)

她依然很穷,要从洗衣房捡别人扔掉的衣服穿,每个周末,都要回家里的干洗店帮忙。大一快结束时,李飞飞的母亲心血管疾病发作,尽管通过手术抢救了回来,但终生不能再从事全职体力劳动。李飞飞家用积蓄和借款开了家干洗店,周末客人会更多,李飞飞要回家帮忙,而且几乎不会说英语的李飞飞父母,也需要女儿做翻译。

来到美国后,李飞飞第一次有了属于自己的房间,宿舍面积甚至比一家三口蜗居的公寓还要大。更重要的是,这里是知识的殿堂,可以帮她找到那颗指引自己的北极星,那个可以改变世界,让她为之痴迷和奋斗的问题。

大二时,李飞飞的兴趣发生转向。当时,在阅读爱因斯坦、波尔、薛定谔等著名科学家传记后,她发现很多人在晚年转而对生命话题感兴趣,探索智慧的奥秘。在1990年代末的计算机热下,另一个问题引起了李飞飞的注意:机器可以掌握人类的智慧吗?

李飞飞就此关注到了人工智能领域。和20多年后这个行业的爆火不同,当时正值“AI寒冬,整个领域停滞不前,缺乏突破,很难获得研究资金。这个时候入行,显然不是好时机。

李飞飞不在乎这些。大学毕业后,她选择到另一家顶级名校加州理工学院深造,两位导师分别来自计算机和神经科学专业。

就在李飞飞满怀期待开始研究生生活时,或许是嫌她吃的苦还不够多,命运又给了她一记暴击。

李飞飞母亲再次病倒,几乎完全不能再从事体力劳动,干洗店的生意难以为继。李飞飞把父母接到自己的宿舍,让母亲在天气更温暖的加州疗养,同时方便照顾他们。

母亲的病随时可能恶化,怎么挣钱给她看病?第一次,李飞飞认真考虑,放弃科研梦想,找一份薪水高的工作。

著名咨询公司麦肯锡正在加州理工学院招聘,李飞飞买了一件得体的西装。这对她来说还是过于奢侈的消费,她没有撕掉标签,而是用衣领遮住,打算面试结束后立刻退回店里。

尽管没有任何工作经验,李飞飞还是凭借才智和韧性打动了麦肯锡,他们不仅同意录用,还把原定招聘的实习生岗转成正式职工岗。

6位数年薪和健康保险近在眼前。最终,却是母亲阻止了李飞飞的决定。她至今都记得母亲当时那段拯救了她人生的话:

飞飞,我们走到这一步,不是为了让你放弃。我了解我的女儿,她不是一个咨询顾问,她是一个科学家。

 

4

给机器呈现整个世界

麦肯锡失去了一位咨询顾问,已经处于谷底的人工智能领域迎来一位转折性的人物。

为了教机器像人一样识别图片中的物体,科学家们首先要搞懂,人是怎么辨识物体的。

因为她,让机器具备像人一样“看”的能力,历史上第一次变成现实 

1990年代前,主流理论认为,人眼辨识物体,是从色彩、形状、明暗等不同层次的微小细节开始,然后建立它们之间的关系,最后在大脑中形成一个完整的画面。

这符合直觉,算法的开发也试图模拟这个过程。

但是,到1990年代,这个理论遭到越来越多人质疑。科学家们通过实验发现,人类具有快速准确的图像识别能力,哪怕在集中注意力做其他事情的同时,也能对快速闪过的图像内容作出精准判断,比如这是一幅风景画,或者,图片里是一只柯基犬

人只要看到某些细节,就能通过自己的丰富经验联想到这个物体可能是什么,并在想象中自动填充其他部分。

换言之,重要的是类别,人通过联想到类别而判断物体是什么。

李飞飞是类别论的支持者。她进一步想到,人是因为有丰富的阅历而能判断出类别,如果想让机器也做到这一点,就需要它们过海量同一类别的图片。

创建一个由人类标注好类别的图片库,让机器学习的想法就此出现。

给机器呈现一个完整的世界,它们之后会开始尝试理解这个世界。这是李飞飞的北极星,她看到了数据的重要意义,在此之前,科学家们只把它当成算法的附庸。

2005年博士毕业后,李飞飞先是在伊利诺伊大学厄巴纳-香槟分校找到教职,一年后被母校普林斯顿挖走。她决心把创建数据库的想法变成现实。

这是一个过于大胆的想法。

几乎包含所有英文词汇的网络WordNet里有约14万个单词,其中,所有可见的物体类名词有2.2万个,如果每一个类别下配1000张图,意味着需要有约两千万张标注好的图片,规模浩大。

同事们都不看好这个项目,当时世界上最大的标注数据集,只有100个分类,图像也只有约1万张,2000万张图像太多了,算法用不了这么多数据,也没有那么强的算力去支持。

连李飞飞导师的导师,师爷吉腾德拉也不看好这个项目,他委婉地提醒李飞飞:科研的诀窍是跟随你的领域一起成长,不要太超前。这尤为让人丧气,李飞飞本打算将来申请终身教职时,请吉腾德拉写推荐信的。

她开始担心,如果继续做ImageNet,自己会失去拿终身教职的机会。

男友西尔维奥支持李飞飞的想法,他们在加州理工读博时结识,都是痴迷机器学习的书呆子性格。你不是一直追求出格的想法吗?西尔维奥说。

李飞飞只有一个研究生做助手,以及少得可怜的经费,这注定是一场豪赌。

外界大概很难想象,最前沿的计算机学习,最开始是个手工活儿。

他们设计出程序,可以自动依照划分好的类别从搜索引擎谷歌上一天24小时不停下载图片。在电脑网络IP被谷歌识别和封杀后,他们又想出了设置动态IP的办法。

一共有几十亿张图片被下载,接下来需要剔除那些画质不高、重复或者不相关的图片,然后手工标注这些图片。

李飞飞请普林斯顿大学本科生们来做兼职标注,每小时10美元,但速度慢得惊人,按这个进度,要18年才能完成。

李飞飞想,自己那时可能已经被普林斯顿开除了。扩张预算、招更多学生来做标注也不现实,工作又陷入死胡同。

众包拯救了他们。一次偶然的机遇,李飞飞听说网络购物平台亚马逊上可以发布众包任务,立刻想到,中国、越南等地人力成本明显低于普林斯顿的本科生,如果把标注任务外包出去呢?

他们成了众包业务早期最大的买家之一。最终在全世界167个国家的4.8万名标注员的共同努力下,仅用了1年时间,这个被命名为ImageNet的图片库就得以问世,这是人类历史上规模最大的标注数据库,和神经网络AlexNet一起,它们将引爆2012年的AI命。

 

5

仰望星空的权利

ImageNet是一个不被看好的项目,即便成功问世,也鲜有人使用——科学家们普遍还没有意识到数据的威力。

为了推广ImageNet2009年,李飞飞组织了迄今为止AI历史上最成功的赛事:ImageNet大规模视觉识别挑战赛。参赛团队可以免费使用ImageNet图像库,但需要自行开发算法,最终以图像识别准确率高低来决定名次。

因为她,让机器具备像人一样“看”的能力,历史上第一次变成现实 

李飞飞传记《我看到的世界》

最开始两届很难说是成功,参赛队伍数量一般,算法识别准确率也没有革命性突破。

事情在2012年迎来转机。这一年,有“AI教父美誉的杰弗里·辛顿和其学生开发的神经网络AlexNet在挑战赛中一举夺魁,并且把识别准确率提高了整整10个百分点。

人工神经网络一战成名。更让科学家惊喜的是,他们意识到,如果不停增加神经网络的层次,识别准确率还会继续提高,这是深度学习的含义。

让机器具备像人一样的能力,历史上第一次变成现实。

更重要的是,用大数据训练多层神经网络的想法,从图像扩展到语音、文字、视频等其他领域,引爆了持续到现在的AI革命。2014年,机器人脸识别准确率已超越人类,突破落地门槛;3年后,AlphaGo横空出世,战胜围棋世界冠军李世石;2022年,ChatGPT的问世更是让整个世界意识到了人工智能的潜力。

这一切的起点和技术基础,是李飞飞的ImageNet2012年的AlexNet

李飞飞就此享誉世界。荣誉、地位、金钱潮水般向她涌来,她拿到了斯坦福大学的终身教职,当选美国工程院院士,成为谷歌云计算部门的首席科学家。李飞飞和西尔维奥结了婚,有了孩子,和自己的父母生活在一起,不用再为钱担心。

给机器呈现整个世界曾经是她的北极星,让她为之痴迷并前行,她做到了,现在,到了要寻找下一颗北极星的时候。毕竟,每个人都有仰望星空的权利,无论是在臭水沟还是已经爬上了山巅。


(声明:本文仅代表作者观点,不代表本站观点,仅做陈列之用)

[责编:tdsr]

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

上一篇:不是“巫术”!“95后”院士用209场演讲为它正名……
下一篇:没有了

猜你喜欢