周二晚8点!和港中文王鸿儒博士,一起聊聊智能体的最优行为,以及如何在实践中实现这种最优性?
青稞Talk 第77期,香港中文大学王鸿儒博士,将直播分享《
青稞社区:https://qingkeai.online
原文:https://mp.weixin.qq.com/s/AFEhdIv6jVFXFKaO9bnx0g
大型语言模型(LLMs)已从单纯的文本生成工具,迅速演变为能够在有限人类监督下自主规划和执行复杂任务的智能体(如OpenAI深度研究、Manus和Alita等)。
然而,随着这些系统日益具备自主性和代理能力,一些根本性问题仍未解决:什么是智能体?其最优行为是什么?如何在实践中实现这种最优性?
9月9日(周二)晚8点,青稞Talk 第77期,香港中文大学王鸿儒博士,将直播分享《Theory of Agent: From Definition, to Behavior and Objective》。
在本次演讲中,我们试图建立一套系统的智能体理论,将其定义为基于工具使用的决策者。
具体而言,我们首先提出一种工具化视角的统一框架,归纳智能体的所有行为归纳为工具调用,并阐述关于知识边界(智能体所知)与决策边界(智能体所行)的三项核心原则。我们提倡真正的自主性取决于决策边界与知识边界的对齐,目标是通过最小化现实世界中的外部动作,高效实现预设目标。
最后,我们提供一套可操作、可扩展的路线图,以实现真正自主的智能体,并展望未来在安全性、个性化和通用性等方面的关键挑战与发展方向。
分享嘉宾
王鸿儒博士于香港中文大学获得博士学位,导师为黄锦辉教授(ACL Fellow),研究方向主要包括对话系统,工具学习以及大语言模型智能体等,英国爱丁堡大学和美国伊利诺伊大学香槟分校(UIUC)访问学者,在国际顶级会议如NeurIPS, ACL, EMNLP, NAACL, COLING等发表30余篇相关论文,其中包括10多篇一作或共一论文,代表工作有Self-DC, OTC-PO,Theory of Agent等,谷歌学术引用超1000次,NeurIPS Area Chair以及多个国际顶级会议审稿人,NICE社区初创成员,曾获得国际博士生论坛最佳论文奖,ACL 2024@SIGHAN 最佳论文奖,WWW2024 Online Safety Prize Challenge冠军等多项荣誉,并在SIGIR 2024组织第一届Tool Learning研讨会,研究获得过TBF, OSCP等多项研究基金支撑,参与多项香港GRF, RGC等项目。
主题提纲
Theory of Agent: From Definition, to Behavior and Objective
1、智能体新定义:决策者即工具使用者
2、知识边界与决策边界的三项核心原则
3、自主性核心:边界对齐,以及最优行为与目标
4、探讨未来的关键挑战与发展方向
直播时间
9月9日20:00 - 21:00
更多推荐
所有评论(0)