亚马逊Nova AI挑战赛加速生成式AI领域发展

首届全球大学竞赛,致力于推动安全、可信的AI辅助软件开发。

发布时间:2025年3月10日

在负责任AI发展框架下,通过与顶尖大学合作以培育突破性研究。认识到许多学术机构缺乏进行大规模研究的资源,我们正在通过“亚马逊Nova AI挑战赛”改变这一格局。虽然该挑战赛将探索生成式AI的多个方面,但今年的重点聚焦于“可信AI:推进安全的AI辅助软件开发,以构建更安全、更可靠的应用程序”。

“这项挑战赛非常独特,”弗吉尼亚理工大学团队的助理教授兼导师贾若溪博士表示,“尖端AI研究通常需要访问大规模训练的模型或开放权重模型。但遗憾的是,开放权重模型往往不具备足够的性能水平。该中心正通过为学术界提供前所未有的资源和真实场景访问,显著降低研究门槛。”

AI正在通过自动化繁琐但必要的任务(例如更新软件)来革新软件开发,使团队能够专注于创新。例如,通过将某中心内部系统集成代码转换功能,团队将Java应用程序升级到Java 17所需的时间从通常的50个开发人日减少到仅几个小时。这估计节省了相当于4500个开发人年的工作量,并产生了约2.6亿美元的年化效率收益。然而,随着AI更多地融入编码过程,不可避免地会带来新的安全挑战。通过主动应对这些风险,从一开始就优先考虑信任和安全。

采用“锦标赛”形式,十支大学队伍——五支模型开发(防御)队和五支红(攻击)队——将在四场连续的锦标赛中进行对抗,以强化基于AI的安全软件开发。每支防御队的代码生成模型都将面对所有五支红队,后者将使用自动化技术探测漏洞和缺陷。某Nova团队为此次挑战在AWS Trainium硬件上构建了一个定制模型,以促进安全软件开发领域的开放、协作研究。

首场锦标赛于2025年1月启动,最终轮次将于2025年6月现场举行。所有团队都将发表研究论文,详细阐述其方法论和发现,最终旨在提升用户体验、防止滥用,并使AI在软件开发中的应用更加安全。挑战赛取得的进展将有助于更广泛的负责任AI开发领域,包括代码生成及其他方面。

“研究通常非常孤立,”卡内基梅隆大学团队的学生负责人Atharva Naik说,“在这里,我们实际上是在与其他研究团队竞争,试图跟上他们的进步并实时超越他们。”Naik强调,锦标赛形式也推动团队快速实施和测试其策略,而不会陷入单一解决方案的困境。

所选队伍类别包括:

  • 模型开发团队: 卡内基梅隆大学、哥伦比亚大学、捷克布拉格捷克技术大学、伊利诺伊大学厄巴纳-香槟分校、弗吉尼亚理工大学。
  • 红队: 葡萄牙里斯本新星科技学院、普渡大学、加州大学戴维斯分校、德克萨斯大学达拉斯分校、威斯康星大学麦迪逊分校。

组织者和参与者一致认为,锦标赛形式已被证明具有高度激励性。攻防系统必须对五支对手队伍有效,并且每支队伍将在每场锦标赛中对阵不同对手的过程中变得更强。

“我们汇集了学术界最优秀、最聪明的人才,不仅是为了竞争,更是为了共同解决生成式AI实际应用中最重要的问题之一——安全可靠的软件开发,”某机构人工通用智能高级副总裁Rohit Prasad说,“我们将这项挑战设计为一场独特的、快节奏的锦标赛,旨在加速面向实际应用的学术研究。按照某中心的传统,我期待参赛团队在通往决赛的路上努力工作,享受乐趣,并创造历史。”

“这项挑战赛体现了我们致力于推进负责任AI开发和安全的承诺,”某中心首席安全官Steve Schmidt表示,“通过与大学合作,我们正在汲取新鲜思想的源泉,并培养未来的AI安全领导者。这项倡议超越了理论研究——它关乎开发识别安全漏洞和防范威胁的新方法,这些方法可以直接应用于生成式AI编码助手。我迫不及待地想看到学生们创造出什么,并分享他们的研究成果。”

每支队伍将获得25万美元的赞助、月度AWS积分以及争夺最高奖项的机会。获胜的红队和模型开发队将各获得25万美元奖金(由学生分配),第二名队伍将获得10万美元。包括津贴、70万美元奖金和AWS积分在内,对团队的总投资超过500万美元。

汇聚精英
挑战赛组织者评审了90多份提案,以选出最终参加挑战的十支队伍。据负责挑战赛背后科学与工程的应用科学负责人Michael Johnston称,这是一个艰难的决定,入选团队必须提出一系列独特且实用的想法。因为每支队伍将面对多个对手,他们需要准备多种策略。并且由于对手会不断调整,这些想法必须展现出创造力和适应性。

挑战赛本质上是跨学科的——位于负责任AI、生成式AI、安全、对话式AI和自动化软件开发的交叉点。因此,它汇集了在多个研究领域具有专业知识的团队,为竞赛带来了不同的才能和视角。

从理论到实践解决方案
亚马逊Nova AI挑战赛鼓励团队以比学术研究通常采用的更务实的视角来解决问题。弗吉尼亚理工大学的贾若溪指出,学术文献往往侧重于理论问题,且偏向于复杂的解决方案。但这并不是这里所需要的。贾若溪表示,挑战赛有助于以对真实人群有益的方式来构建问题。在她与某中心研究人员的交谈中,她清楚地了解到,他们对过于复杂的解决方案并不感兴趣。“他们告诉我,他们想要最简单的解决方案:一个稳健且易于排查的解决方案,”她说,“这可能会让人大开眼界,并在一定程度上重塑我的研究理念。”

团队还能访问在学术界通常不易获得的资源水平。“我们正在尝试新事物,这在学术预算下通常非常困难,”Naik说。他的团队通常使用较小的数据集,并且没有机会训练LLM或运行大型实验。捷克技术大学团队的学生负责人Ondrej Kobza在训练营期间也有类似的深刻印象。“我们立即获得了AWS Trainium芯片的访问权限,这是一个由AWS专为AI训练和推理构建的AI芯片系列,旨在降低成本的同时提供高性能。这真是太棒了,特别是对于来自捷克一所小型大学的团队来说,我们没有机会接触到如此强大的硬件。”

“这项挑战赛与我们的研究兴趣非常契合,”普渡大学教授、其学校团队顾问Xiangyu Zhang说,“我们确实需要竞争这额外的一步。我们正在从各个角度进行攻击。”

敬请关注团队进展的更新以及2025年6月决赛的报道。

研究领域

  • 对话式AI
  • 安全、隐私和滥用防护

标签

  • 生成式AI
  • 负责任AI
  • 大语言模型
  • 学术合作
  • 某Nova

关于作者

  • 撰稿人
    更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
    对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐