前言

当我们谈论人工智能时,我们谈论的是算法、数据、算力,是那些冰冷的代码和复杂的模型。但在《我看见的世界:李飞飞自传》中,李飞飞用她独特的视角告诉我们:AI的本质,是人类对"看见"世界的渴望与探索

这本书采用了一种巧妙的"双螺旋"叙事结构——一条线是李飞飞从成都小女孩到美国三院院士的个人成长史,另一条线是人工智能从边缘领域到掀起全球革命的技术发展史。两条线索相互交织,围绕"看见"这个核心主题层层递进,让我们看到了一个有温度、有深度、有思考的AI世界。

今天,我们将深入解读这本书的前6章,看看李飞飞是如何在人生的不同阶段,一步步"看见"自我、"看见"技术、"看见"未来的。

01 如坐针毡的华盛顿之行:站在科学与政治的十字路口

章节核心: 2018年6月26日,李飞飞在美国国会就"人工智能——威力越大,责任越大"主题做证。这一章以这个极具张力的场景开篇,展现了她作为科学家在面对公众质疑和政治审视时的复杂心情,也为全书奠定了"科技必须以人为本"的基调。

1.1 三重身份的挣扎

在前往国会大厦的路上,李飞飞的内心充满了矛盾和不安。她同时拥有三重身份:

  • 科学家:坚信人工智能可以让世界变得更好
  • 移民:20多年前还只是一个英语蹩脚、经济拮据的少女
  • 女儿:母亲正在医院重症监护室,她随时可能接到紧急电话

这种多重身份的叠加,让她对AI的理解比大多数人更加深刻。她写道:“像许多移民一样,我感到被各种纵横交错的文化鸿沟所束缚。一些鸿沟不可名状,另一些则清晰地横亘在我的面前,难以跨越。”

1.2 科技抵制浪潮下的反思

2018年正值"科技抵制浪潮"高涨之际,媒体持续报道算法偏见、人工智能可能导致的大量失业,以及这一技术被用于监控带来的不安。作为当时谷歌云的首席人工智能科学家,李飞飞被卷入了争议的中心。

但她并没有回避这些问题,而是在《纽约时报》发表专栏文章,尝试在兴奋与担忧之间找到平衡:“人工智能对世界的真正影响,将在很大程度上取决于推动这项技术发展的动机——在人脸识别功能和定向广告投放不断发展的时代,这一观点挑战了现有认知。”

1.3 一个朴素的信念

当她走进听证会大厅,看到自己的名字"李博士"用新罗马字体印在一张朴素的席位卡上时,悬着的心顿时放松了许多。在这个庄严的时刻,她的脑子里只有一个信条:“发展的动机最重要”

她坚信:“人工智能技术可以让世界变得更好。虽然实现愿景的具体路径仍然悬而未决,但已经明确的是,即将开始的这场对话和类似的交流是我们解答这个问题的最佳机会。”

这一章的结尾,李飞飞写道:"20多年前开启的一段旅程决定了我将成为什么样的人。道路漫漫,时而荆棘遍地,时而柳暗花明。"而这段旅程的起点,要从她的童年说起。

在这里插入图片描述

02 逐梦之旅:好奇心是人生的第一道光

章节核心: 这一章回溯了李飞飞的童年时光和移民经历,展现了她性格中最核心的两个特质——永不满足的好奇心坚韧不拔的毅力。这些特质不仅帮助她度过了人生最艰难的岁月,也成为她日后科研道路上最宝贵的财富。

2.1 成都郊外的星空与自然

李飞飞1976年出生于北京,后随家人迁居成都。这座被盆地环绕、满是烟火气的城市,成为她童年最温暖的底色。她对世界的好奇,最早源于父亲陪伴下的自然探索。

书中有一段非常动人的描写:“树冠枝繁叶茂,在我们头顶高处摇曳,勾勒出的纯净阴影仿佛画框,展示着夜空的画卷。美术老师指着天上的各个星座,我和身边的几个同学都伸长了脖子,目不转睛地仰头观望。我们全神贯注地听着讲解,四周安静极了,连老师近乎耳语的声音似乎都能传到下面的峡谷里,而每当有流星划过,我们就会忍不住发出阵阵惊叹。”

就是在这次野外徒步中,美术老师向她介绍了北极星——“这可能是几百年来天上最重要的恒星”。这个名字在她心中留下了深刻的印象,成为她日后人生道路上的一个重要隐喻。

2.2 16岁的移民:从天堂到地狱

1992年,16岁的李飞飞跟随父母移民美国新泽西州。这是她人生的重大转折点,也是一段充满艰辛的岁月。刚到美国时,她面临着三重绝境:

  • 语言不通:几乎不会说英语,课堂上完全听不懂老师讲课
  • 文化隔阂:陌生的环境、不同的生活习惯,让她感到孤独与迷茫
  • 经济困难:父母无法找到理想的工作,家庭拮据,她不得不利用课余时间在干洗店打工

“对一个经济拮据、英语蹩脚的家庭来说,出门旅行困难重重。大多数活动可以按照免费和太贵来筛选安排;而且所有活动都是英语讲解,英语非母语的阴霾始终笼罩着我,似乎永远难以消散。”

2.3 逆袭:从"差生"到普林斯顿学子

这段艰难的经历,没有击垮李飞飞,反而磨砺了她的意志。她牢记父母的教诲,拼命学习英语,同时坚守自己擅长的数学与科学——这些"通用语言",成为她在美国找到自信的突破口。

她曾说:"学习不是球赛,他们无法阻止我上场参赛,我暗下决心一定要赢。"这种不服输的信念,支撑着她在困境中不断前行。不到4年时间,李飞飞实现了惊人的逆袭:以优异的成绩考入普林斯顿大学物理学专业,获得全额奖学金。

这段经历让她深刻体会到:“语言、国界、环境并不是阻碍我们去看世界的因素,如果你心里有这样的世界,那你必定可以走到那里。”

03 鸿沟渐窄:从物理学到计算机科学的跨越

章节核心: 这一章讲述了李飞飞在普林斯顿大学的学习经历,以及她如何从物理学转向计算机科学,最终找到自己一生的研究方向——计算机视觉。这个过程充满了迷茫与探索,但也让她逐渐看清了自己的"北极星"。

3.1 物理学的魅力与局限

进入普林斯顿大学后,李飞飞最初选择的是物理学专业。她被物理学的简洁与优美深深吸引,认为物理学是"解释宇宙最根本规律的科学"。

但随着学习的深入,她开始感到一种不满足。物理学研究的是客观世界的规律,而她更感兴趣的是人类如何感知和理解这个世界。她开始思考:“我们的大脑是如何将视网膜上的二维图像,转化为我们对三维世界的丰富认知的?”

3.2 一个改变一生的问题

一个偶然的机会,李飞飞接触到了计算机科学。当她第一次听到"计算机能看见吗?"这个问题时,她被深深迷住了。

在当时,计算机视觉还是一个非常边缘的领域,大多数研究者认为,让机器"看见"和"理解"世界是不可能的。相关研究资金匮乏、关注度极低,甚至被一些人视为"伪科学"。

但李飞飞却有着不同的看法。她认为:“视觉是人类最重要的感知方式,我们获取的信息中有80%来自视觉。如果计算机能够学会’看见’,那将是一场革命性的突破。”

3.3 跨越学科的鸿沟

从物理学转向计算机科学,意味着要跨越巨大的知识鸿沟。李飞飞不得不从头开始学习编程、算法、数据结构等计算机基础知识。这个过程非常艰难,但她从未放弃。

她在普林斯顿结识了许多优秀的导师和同学,在他们的影响下,她开始深入探索计算机视觉领域。她发现,这个领域正好结合了她对物理学的热爱和对人类认知的好奇——它既需要严谨的数学和逻辑思维,又需要对人类感知和认知过程的深刻理解。

"鸿沟渐窄"这个标题,不仅指李飞飞跨越了物理学与计算机科学之间的学科鸿沟,也指她逐渐缩小了自己与梦想之间的距离。她终于找到了自己愿意为之奋斗一生的事业。

04 心智探索:理解人类,才能理解机器

章节核心: 这一章讲述了李飞飞在加州理工学院攻读博士学位的经历。在这里,她开始深入研究人类视觉系统的工作原理,试图从生物学和神经科学中寻找灵感,来构建更好的计算机视觉系统。她逐渐认识到:要让机器"看见"世界,首先要理解人类是如何"看见"世界的。

4.1 大脑的奇迹

李飞飞在书中写道:“尽管构成大脑大部分结构的神经元相对简单,但大脑也许是最能充分诠释’量变引起质变’这一公理的例子。当神经元以千亿计的数量级复制,当它们之间的连接达到10的11次方时,质变就发生了。物质变成了思维,产生了爱、喜悦、悲伤、愤怒、恐惧和欢笑,也造就了我们在科学、艺术、音乐和数学等方面的能力。”

她花了大量时间研究神经科学和认知心理学,了解人类视觉系统的工作原理。她发现,人类的视觉系统并不是一个简单的"照相机",而是一个极其复杂的信息处理系统。它不仅能捕捉光线,还能进行模式识别、物体分类、场景理解等高级认知活动。

4.2 一个关键的抉择

在加州理工期间,李飞飞面临着一个重要的人生抉择。当时,有一家华尔街的投资银行向她伸出了橄榄枝,开出了非常诱人的薪水。这笔钱足以彻底改变她和家人的生活。

她犹豫了很久,最终还是向母亲寻求建议。母亲只问了她一个简单的问题:“飞飞,这是你想要的吗?”

李飞飞回答:“你知道我想要什么,我想成为一名科学家。”

母亲说:“那还有什么好说的呢?”

这段对话成为了李飞飞人生中的一个重要转折点。她拒绝了华尔街的高薪诱惑,坚定地走上了科研道路。这个决定,不仅改变了她的人生,也改变了人工智能的发展轨迹。

4.3 数据的力量

在加州理工的研究中,李飞飞逐渐意识到一个被大多数研究者忽视的问题:数据的重要性

当时,计算机视觉领域的研究主要集中在算法和模型的改进上,而数据集的规模通常很小,只有几千张图片,涵盖几十个类别。李飞飞认为,这就像教一个婴儿认识世界,只给他看几张图片一样,是不可能成功的。

她开始思考:“如果我们给计算机提供足够多、足够丰富的数据,它会不会像人类一样,学会识别和理解世界?”

这个想法,为后来创建ImageNet埋下了伏笔。

05 第一道光:计算机视觉的黎明

章节核心: 这一章讲述了李飞飞博士毕业后的早期科研经历。此时,人工智能领域正处于第二次"寒冬",计算机视觉的发展陷入瓶颈。但李飞飞没有放弃,她在黑暗中坚持探索,终于看到了"第一道光"——她发现了数据驱动方法的巨大潜力,并开始着手构建更大规模的图像数据集。

5.1 AI寒冬中的坚守

20世纪90年代末到21世纪初,人工智能领域经历了第二次"寒冬"。由于之前的一些承诺没有兑现,政府和企业对AI的投资大幅减少,许多研究者纷纷转向其他领域。

计算机视觉作为AI的一个分支,也受到了严重影响。研究资金匮乏,论文发表困难,甚至有人断言:“计算机视觉是一个没有前途的领域。”

但李飞飞却坚信,计算机视觉有着广阔的应用前景。她在书中写道:“当然,具体的工作细节并不重要;它只是再次证明了我们实验室的核心价值:永远尊重世界的复杂性,并渴望不惜一切代价对其进行探索。”

在这里插入图片描述

5.2 从Caltech 101到ImageNet的萌芽

2004年,李飞飞和她的导师Pietro Perona一起创建了Caltech 101数据集。这个数据集包含了超过9000张图片,分布在101个类别中,是当时规模最大的图像数据集之一。

Caltech 101的创建,在计算机视觉领域引起了不小的轰动。它为研究者提供了一个统一的测试基准,大大促进了算法的比较和改进。

但李飞飞并不满足于此。她认为,101个类别和9000张图片,对于真实世界的复杂性来说,还是太少了。她有了一个更大胆的想法:创建一个包含数百万张图片、涵盖数万个类别的超大规模图像数据集

这个想法,就是后来的ImageNet。

5.3 一个疯狂的计划

当李飞飞提出创建ImageNet的想法时,几乎所有人都认为她疯了。

“这是不可能完成的任务!”
“收集和标注这么多图片,需要花费多少钱和时间?”
“即使你做出来了,又有什么用呢?”

面对质疑,李飞飞没有动摇。她坚信:“数据是人工智能的燃料。没有足够的数据,再先进的算法也无法发挥作用。”

她在书中写道:"我找到了属于自己的北极星。"而这个北极星,就是通过理解物体来理解视觉世界,就是用数据点亮AI的未来。

06 北极星:找到一生的科研方向

章节核心: 这一章是前6章的高潮和总结。李飞飞正式确立了自己一生的科研方向——通过大规模数据驱动的方法,让计算机学会"看见"和理解世界。她将这个方向比作自己的"北极星",无论遇到什么困难和挫折,都始终指引着她前行。

6.1 Caltech 101的成功与局限

2004年,Caltech 101正式发布。正如李飞飞所预期的那样,它迅速成为计算机视觉领域最流行的数据集之一。几乎所有的研究者都在使用Caltech 101来测试和比较他们的算法。

但Caltech 101也暴露了一些明显的局限:

  • 类别数量太少(只有101个)
  • 每个类别的图片数量太少(平均每个类别只有约90张)
  • 图片的多样性不足(很多图片都是在相似的背景下拍摄的)

这些局限,让李飞飞更加坚定了创建更大规模数据集的决心。

6.2 一个人的坚持

在创建ImageNet的初期,李飞飞几乎是一个人在战斗。她没有足够的资金,没有足够的人手,甚至没有足够的计算资源。

她亲自从互联网上收集图片,一张张进行筛选和标注。这个过程非常繁琐和枯燥,但她从未抱怨。她在书中写道:“如果彼得罗想要100个类别,我就给他101个。”

这种近乎偏执的坚持,最终打动了她的同事和学生。越来越多的人加入到ImageNet项目中来,团队逐渐壮大。

6.3 北极星的指引

"北极星"这个比喻,在这一章中被反复提及。对于李飞飞来说,北极星代表着:

  • 清晰的目标:让计算机学会"看见"和理解世界
  • 坚定的信念:相信数据驱动的方法能够解决计算机视觉的核心问题
  • 不变的初心:让人工智能服务于人类福祉

她在书中写道:“从普林斯顿大学到伯克利,我接触到真正的科学给我带来的兴奋感。我确定自己无比热爱研究,我要找到属于自己的北极星。”

在这一章的结尾,李飞飞站在了一个新的起点上。她已经找到了自己的北极星,接下来,她将带领团队,踏上创建ImageNet的伟大征程。而这个项目,将彻底改变人工智能的发展轨迹。

前6章核心感悟与启示

读完《我看见的世界》前6章,我有以下几点深刻的感悟:

1. 好奇心是最好的老师

李飞飞的成功,首先源于她永不满足的好奇心。从童年时对星空和自然的好奇,到后来对人类视觉系统的好奇,再到对计算机能否"看见"世界的好奇,好奇心始终是她前进的动力。

正如爱因斯坦所说:"好奇心是科学工作者产生无穷的毅力和耐心的源泉。"在AI快速发展的今天,保持好奇心比任何时候都更加重要。

2. 起点不决定终点

李飞飞从一个语言不通、经济拮据的移民少女,成长为全球AI领域的领军人物,她的经历告诉我们:外在条件可以限制我们的起点,但不能决定我们的终点。

真正决定一个人能走多远的,是他的内心世界——他的梦想、他的信念、他的毅力。只要心中有光,脚下有路,每个人都能创造属于自己的奇迹。

3. 敢于走别人没有走过的路

在大多数人都认为计算机视觉没有前途的时候,李飞飞选择了这个领域;在大多数人都认为创建ImageNet是不可能完成的任务的时候,她坚持了下来。

她的成功告诉我们:真正的创新,往往发生在别人看不到的地方。敢于走别人没有走过的路,才能看到别人看不到的风景。

4. 科技必须以人为本

从第一章在国会做证时强调"发展的动机最重要",到后来提出"以人为本的AI"核心理念,李飞飞始终认为,科技的最终目的是服务于人类福祉。

在AI技术飞速发展的今天,我们不能只关注技术的进步,更要关注技术的社会影响。我们要确保AI的发展始终沿着正确的方向前进,让技术成为推动社会进步、改善人类生活的力量。

结语

《我看见的世界》前6章,为我们展现了李飞飞人生的前半段旅程。从成都郊外的星空下,到美国国会的听证会上;从干洗店打工的少女,到斯坦福大学的终身教授;从对世界充满好奇的孩子,到引领AI革命的科学家——李飞飞用她的经历告诉我们:人生就是一场持续"看见"的旅程。

我们"看见"的不仅是外部世界,更是我们自己的内心;我们"看见"的不仅是技术的可能性,更是技术背后的人性;我们"看见"的不仅是当下的挑战,更是未来的希望。

在下一篇文章中,我们将继续解读《我看见的世界》的后6章,看看李飞飞是如何带领团队创建ImageNet,如何引爆深度学习革命,以及如何提出"以人为本的AI"核心理念的。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐