在这里插入图片描述

通过研究机器的“思考”方式,我们能对人类智能有哪些了解?如果我们能更好地理解那些正成为我们日常生活中更重要部分的人工智能系统,是否能更好地了解我们自己?

这些问题可能带有深刻的哲学性,但对于菲利普·伊索拉来说,寻找答案既要靠思考,也要靠计算。

伊索拉是电气工程与计算机科学系(EECS)新获终身教职的副教授,他从计算角度研究类人智能所涉及的基本机制。

虽然理解智能是首要目标,但他的研究工作主要集中在计算机视觉和机器学习领域。伊索拉尤其感兴趣的是探索智能如何在人工智能模型中产生、这些模型如何学习表征周围的世界,以及它们的“大脑”与人类创造者的大脑有哪些共同之处。

“我认为所有不同类型的智能都有很多共同点,我想弄清楚这些共同点。所有动物、人类和人工智能有什么共同之处?”同时也是计算机科学与人工智能实验室(CSAIL)成员的伊索拉说道。

对伊索拉来说,更好地从科学角度理解人工智能智能体所拥有的智能,将有助于世界将它们安全有效地融入社会,最大限度地发挥它们造福人类的潜力。

提出问题

伊索拉从小就开始思考科学问题。

在旧金山长大期间,他和父亲经常沿着加利福尼亚州北部的海岸线徒步旅行,或者在雷耶斯角附近以及马林县的山区露营。

他对地质作用十分着迷,常常好奇是什么让自然界得以运转。在学校里,伊索拉被一种永不满足的好奇心所驱使,虽然他倾向于数学和科学等技术性学科,但他渴望学习的知识是没有边界的。

伊索拉在耶鲁大学读本科时,不太确定该学什么,他四处涉猎,直到接触到认知科学。

“我早期的兴趣在于大自然——世界是如何运转的。但后来我意识到,大脑甚至比行星的形成更有趣、更复杂。现在,我想知道是什么让我们保持活力,”他说。

作为一名大一学生,他开始在其认知科学教授、即将成为他导师的布莱恩·斯科尔的实验室工作,斯科尔是耶鲁大学心理学系的成员。在整个本科期间,他都留在那个实验室。

在间隔年与一些儿时好友在一家独立视频游戏公司工作后,伊索拉准备重新投入到人类大脑这个复杂的世界中。他考入了麻省理工学院的脑与认知科学研究生项目。

“研究生院是我终于找到归属感的地方。我在耶鲁以及人生的其他阶段有过很多很棒的经历,但当我来到麻省理工学院时,我意识到这才是我真正热爱的工作,这里的人与我的想法相似,”他说。

伊索拉将自己的博士导师、约翰与桃乐丝·威尔逊视觉科学教授泰德·阿德尔森视为对自己未来道路产生重大影响的人。阿德尔森专注于理解基本原理,而非仅仅追求新的工程基准——这些基准是用于衡量系统性能的规范化测试,这一点启发了伊索拉。

一种计算视角

在麻省理工学院,伊索拉的研究方向逐渐转向了计算机科学和人工智能。

“我仍然喜欢认知科学中的所有这些问题,但我觉得如果从纯粹的计算角度来研究,我能在其中一些问题上取得更大进展,”他说。

他的论文聚焦于感知分组,这涉及到人和机器将图像的离散部分组织成一个单一、连贯的物体所使用的机制。

如果机器能够自主学习感知分组,这将使人工智能系统无需人类干预就能识别物体。这种自监督学习在自动驾驶汽车、医学成像、机器人技术和自动语言翻译等领域都有应用。

从麻省理工学院毕业后,伊索拉在加州大学伯克利分校完成了博士后研究,这样他就可以在一个专注于计算机科学的实验室工作,从而拓宽自己的视野。

“那次经历让我的工作变得更有影响力,因为我学会了在理解智能的基本、抽象原理与追求一些更具体的基准之间取得平衡,”伊索拉回忆道。

在伯克利分校期间,他开发了图像到图像的转换框架,这是一种早期形式的生成式人工智能模型,例如,它可以将草图转换为照片图像,或者将黑白照片转换为彩色照片。

他进入了学术就业市场,并接受了麻省理工学院的教职,但伊索拉推迟了一年,去当时一家名为OpenAI小型初创公司工作。

“那是一家非营利组织,当时我很喜欢它充满理想主义的使命。他们非常擅长强化学习,我觉得这似乎是一个值得深入学习的重要课题,”他说。

他喜欢在拥有如此多科学自由的实验室工作,但一年后,伊索拉准备回到麻省理工学院,组建自己的研究团队。

研究类人智能

运营一个研究实验室立刻吸引了他。

“我真的很喜欢一个想法的早期阶段。我觉得自己就像是一个创业孵化器,能够不断地做新事情、学新东西。”他说。

基于他对认知科学的兴趣以及对人类大脑的理解渴望,他的团队研究了机器中出现的类人智能所涉及的基本计算。

一个主要的关注点是表征学习,即人类和机器表征及感知周围感官世界的能力。

在近期的研究中,他和他的合作者发现,从大型语言模型到计算机视觉模型再到音频模型,多种不同类型的机器学习模型似乎都以相似的方式来表征世界。

这些模型旨在完成截然不同的任务,但它们的架构存在诸多相似之处。而且,随着模型规模不断扩大,训练数据日益增多,它们的内部结构也变得越来越相似。

这促使伊索拉和他的团队提出了柏拉图式表征假说(其名称源自希腊哲学家柏拉图),该假说认为,所有这些模型所学习的表征都在朝着一种共享的、潜在的现实表征汇聚。

“语言、图像、声音——所有这些都是墙上不同的影子,你可以从中推断出存在某种潜在的物理过程——某种因果现实——就在外面。伊索拉说:‘如果你用所有这些不同类型的数据训练模型,它们最终应该会收敛到那个世界模型上。’”

他的团队研究的一个相关领域是自监督学习。这涉及到人工智能模型在没有可学习的带标签示例的情况下,学习对图像中相关像素或句子中相关词语进行分组的方法。

由于数据成本高昂且标签有限,仅使用带标签的数据来训练模型可能会限制人工智能系统的能力。在自监督学习中,目标是开发出能够自主形成对世界准确内部表征的模型。

“如果你能对世界做出良好的呈现,那后续的问题解决应该会更容易。”他解释道。

伊索拉的研究重点更多在于发现新颖且令人惊讶的事物,而非构建能够超越最新机器学习基准的复杂系统。

虽然这种方法在发现创新技术和架构方面取得了很大成功,但这也意味着相关工作有时缺乏具体的最终目标,这可能会带来一些挑战。

他说,例如,当实验室专注于寻找意外结果时,要保持团队协调一致并确保资金持续流入可能会很困难。

“从某种意义上说,我们总是在黑暗中工作。这是一项高风险高回报的工作。偶尔,我们会发现一些全新且令人惊讶的真理核心,”他说。

除了追求知识,伊索拉还热衷于向新一代科学家和工程师传授知识。在他最喜欢教授的课程中,有一门是6.7960(深度学习),这门课是他和麻省理工学院的其他几位教员四年前开设的。

这门课的学生数量呈指数级增长,从最初开设时的30名学生增加到今年秋季的700多名。

虽然人工智能的普及意味着有大量感兴趣的学生,但该领域的发展速度之快,使得人们很难区分炒作和真正意义重大的进展。

“我告诉学生们,对我们在课堂上说的所有内容都不能全信。也许几年后,我们会告诉他们一些不一样的东西。我们这门课程确实处于知识的前沿。”他说。

但伊索拉也向学生们强调,尽管围绕最新的人工智能模型有诸多炒作,但智能机器远比大多数人想象的要简单得多。

“人类的聪明才智、创造力和情感——许多人认为这些永远无法被建模。事实可能确实如此,但我认为,一旦我们理解了智能,它其实相当简单。”他说。

尽管伊索拉目前的工作聚焦于深度学习模型,但他仍然对人类大脑的复杂性着迷,并持续与研究认知科学的研究人员合作。

自始至终,他都被自然界的美景深深吸引,正是这种美景激发了他对科学最初的兴趣。

虽然如今他用于爱好的时间减少了,但伊索拉喜欢在山区或科德角远足和背包旅行,喜欢滑雪和皮划艇,或者在参加科学会议出差时寻找风景优美的地方消磨时光。

虽然伊索拉期待着在麻省理工学院的实验室里探索新的问题,但他不禁思考智能机器的角色可能会如何改变他的工作进程。

他认为,通用人工智能(AGI)——即机器能够像人类一样学习并应用知识的阶段——并非遥不可及。

“我不认为人工智能会为我们做所有事情,而我们只需去海滩享受生活。我认为智能机器和人类之间将会存在共存关系,人类仍然拥有很大的能动性和控制权。现在,我在思考一旦这种情况发生,会出现哪些有趣的问题和应用。在后AGI时代,我该如何为这个世界提供帮助?我目前还没有任何答案,但这个问题一直在我脑海中。”他说。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐