来自身边小伙伴的LLMs+Agent成果：AFlow

言归正传，随着近期OpenAI o1的发布以及test-time compute scaling law的袭来，对RL与LLM融合的思想范式被大家所认同和熟知，但我想当前我们对这一范式的探索也仅仅是冰山一角，不管是显式的对于复杂推理任务空间的持续探索策略与奖励反馈，还是对隐含在显式推理下模型对底层认知机理中的泛化与表征，包括推理框架在真实任务场景实践落地过程中工程与效率在平衡与优化上的诸多tric

吕小明么

1420人浏览 · 2024-10-16 08:18:28

吕小明么 · 2024-10-16 08:18:28 发布

分享并宣传一篇来自身边小伙伴们的近期成果，AFLOW：AUTOMATING AGENTIC WORKFLOW GENERATION - 自动生成代理工作流

需要跟大伙说明一下的是，我与这群年轻且富有激情有想法爱探索的小伙伴们结识于今年夏天阿里巴巴举办的全球数学竞赛AI挑战赛赛后的某次远程脑暴讨论会，并在会上与冠🥇、亚🥈、季🥉军个人/团体探讨分享了当下AI4S及RL×LLM的诸多想法，会后组建了产业学术群，群中每天各种想法，分享，互助满天飞，我想这种的卷才有价值也很有趣吧～不像..啧啧...

下面来看看这篇工作成果 - AFlow：

其中意义和价值仅从我的视角中为大家总结一下：

ps：大家可千万不要局限于此，建议阅读原文，相信有不一样的体会