评价 Analemma(日行迹)开发的 FARS (Fully Automated Research System) 及其产生的论文,需要剥离对 AI 的狂热滤镜,从“系统工程能力”和“学术增量本质”两个维度来客观剖析。

在前不久的公开直播中,FARS 展示了令人震撼的全自动化科研流水线:在无人干预的情况下,自主完成从提出假设 (Ideation)设计实验 (Planning)编写代码执行 (Experiment)撰写论文 (Writing) 的全流程,并以大约每 2 小时一篇的速度量产了上百篇论文。

一、 对 FARS 系统本身的评价

1. 极具开创性的“科研流水线”工程壮举
FARS 的核心突破在于多智能体(Multi-agent)工作流的高度工程化闭环。它把科研过程彻底解构成了模块化的工厂流水线,智能体各司其职且能并发执行任务。这种从“手工小作坊”到“工业化大生产”的范式转移,是它最亮眼的成就。

2. 极高的运行门槛与“烧钱”属性
FARS 目前绝对不是普通研究者用得起的平民工具。根据官网(https://analemma.ai/fars/)揭示的数据,其长时间运行跑出 160 多篇论文消耗了超 200 亿 Tokens。

3. 严重的领域局限性(目前)
目前 FARS 几乎被锁定在 AI for AI (AI4AI) 领域,尤其是大语言模型相关的实证研究。这是因为在这个领域中,提出假设、编写代码和验证结果可以在纯数字环境中闭环。一旦涉及需要物理接触或需要现实世界反馈的领域,FARS 就无能为力了。


二、 FARS 产生的论文是否有价值?

答案是:有价值,但这种价值与人类传统定义的“顶会论文”或“突破性论文”完全不同。

它的论文价值主要体现在以下几个截然不同的维度:

1. 填补“负面结果(Negative Results)”的巨大黑洞
人类学术界存在严重的“发表偏差(Publication Bias)”——只发表成功的实验,失败的尝试往往被束之高阁。而 FARS 是没有学术功利心和职称压力的,它会诚实、详尽地报告那些失败的假设和走不通的死胡同。这对于学术界来说是极具价值的排雷指南,能帮后续的人类研究者省下无数的时间和经费。

2. 暴力穷举式的微小创新与参数实证
FARS 产出的大多是短论文(Short papers),聚焦单一且具体的贡献点。它很难提出跨时代的理论,但它极其擅长在已有的技术框架下进行参数调优、机制微调或组合验证。人类科学家没精力去把 100 种微小的可能性全试一遍,而 FARS 或其他的计算机系统可以。这种穷举式的实证是对人类研究的完美补充。

3. “副产品”的价值甚至高于论文本身
很多时候,FARS 产出的那篇按照八股文格式生成的 PDF 文本并不是最宝贵的。它在“实验阶段”自主生成的高质量代码库、测试脚本、系统架构设计以及原始实验数据,本身就是一种极具价值的“智力资产”,是可以被其他研究者直接复用甚至交易的。目前Analemma招募了相关文员对生成的论文进行评估,可以关注后续对论文质量的评估结果。或者你也可以前往官网亲自阅读那些论文。

4. 致命的缺乏:没有“从 0 到 1”的思想压强
这些论文最大的缺陷在于平庸吗,缺乏创新。FARS 擅长的是基于现有文献的知识插值(Interpolation),而不是颠覆性的范式转移(Paradigm shift)。它能够敏锐地发现两篇论文之间的交叉空白,但它写不出具有极高直觉跳跃和人类思想深度的文章。

总结

FARS 并不是来抢夺诺贝尔奖的,它的本质是一个不知疲倦的“高级科研蓝领”或“学术探路机器”

它产生的论文价值在于广度、实证和排雷,而非深度和开创性。它预示着未来的科研范式将发生根本改变:人类顶尖科学家将把精力完全收缩到**“提出宏观愿景”、“定义有价值的问题”和“进行伦理与价值判断”**上,而把所有需要耗费大量脑力进行代码验证、文献比对和格式撰写的“学术苦力活”,全部外包给 FARS 这样的自动化系统。

本质上FARS是一个科学家“助手”,而不是科学家。从前实验依赖于超级计算机,依赖于科学家编写的实验程序,现在有FARS或类似系统的参与,或许能够一定程度上提升科研的效率。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐