【学习报告】Analemma（日行迹）开发的FARS系统的一些思考

damonchan1999

285人浏览 · 2026-04-17 14:55:17

damonchan1999 · 2026-04-17 14:55:17 发布

评价 Analemma（日行迹）开发的 FARS (Fully Automated Research System) 及其产生的论文，需要剥离对 AI 的狂热滤镜，从“系统工程能力”和“学术增量本质”两个维度来客观剖析。

在前不久的公开直播中，FARS 展示了令人震撼的全自动化科研流水线：在无人干预的情况下，自主完成从提出假设 (Ideation)、设计实验 (Planning)、编写代码执行 (Experiment) 到撰写论文 (Writing) 的全流程，并以大约每 2 小时一篇的速度量产了上百篇论文。

一、对 FARS 系统本身的评价

1. 极具开创性的“科研流水线”工程壮举
FARS 的核心突破在于多智能体（Multi-agent）工作流的高度工程化闭环。它把科研过程彻底解构成了模块化的工厂流水线，智能体各司其职且能并发执行任务。这种从“手工小作坊”到“工业化大生产”的范式转移，是它最亮眼的成就。

2. 极高的运行门槛与“烧钱”属性
FARS 目前绝对不是普通研究者用得起的平民工具。根据官网（https://analemma.ai/fars/）揭示的数据，其长时间运行跑出 160 多篇论文消耗了超 200 亿 Tokens。

3. 严重的领域局限性（目前）
目前 FARS 几乎被锁定在 AI for AI (AI4AI) 领域，尤其是大语言模型相关的实证研究。这是因为在这个领域中，提出假设、编写代码和验证结果可以在纯数字环境中闭环。一旦涉及需要物理接触或需要现实世界反馈的领域，FARS 就无能为力了。

二、 FARS 产生的论文是否有价值？

答案是：有价值，但这种价值与人类传统定义的“顶会论文”或“突破性论文”完全不同。

它的论文价值主要体现在以下几个截然不同的维度：

1. 填补“负面结果（Negative Results）”的巨大黑洞
人类学术界存在严重的“发表偏差（Publication Bias）”——只发表成功的实验，失败的尝试往往被束之高阁。而 FARS 是没有学术功利心和职称压力的，它会诚实、详尽地报告那些失败的假设和走不通的死胡同。这对于学术界来说是极具价值的排雷指南，能帮后续的人类研究者省下无数的时间和经费。

2. 暴力穷举式的微小创新与参数实证
FARS 产出的大多是短论文（Short papers），聚焦单一且具体的贡献点。它很难提出跨时代的理论，但它极其擅长在已有的技术框架下进行参数调优、机制微调或组合验证。人类科学家没精力去把 100 种微小的可能性全试一遍，而 FARS 或其他的计算机系统可以。这种穷举式的实证是对人类研究的完美补充。

3. “副产品”的价值甚至高于论文本身
很多时候，FARS 产出的那篇按照八股文格式生成的 PDF 文本并不是最宝贵的。它在“实验阶段”自主生成的高质量代码库、测试脚本、系统架构设计以及原始实验数据，本身就是一种极具价值的“智力资产”，是可以被其他研究者直接复用甚至交易的。目前Analemma招募了相关文员对生成的论文进行评估，可以关注后续对论文质量的评估结果。或者你也可以前往官网亲自阅读那些论文。

4. 致命的缺乏：没有“从 0 到 1”的思想压强
这些论文最大的缺陷在于平庸吗，缺乏创新。FARS 擅长的是基于现有文献的知识插值（Interpolation），而不是颠覆性的范式转移（Paradigm shift）。它能够敏锐地发现两篇论文之间的交叉空白，但它写不出具有极高直觉跳跃和人类思想深度的文章。

总结

FARS 并不是来抢夺诺贝尔奖的，它的本质是一个不知疲倦的“高级科研蓝领”或“学术探路机器”。

它产生的论文价值在于广度、实证和排雷，而非深度和开创性。它预示着未来的科研范式将发生根本改变：人类顶尖科学家将把精力完全收缩到**“提出宏观愿景”、“定义有价值的问题”和“进行伦理与价值判断”**上，而把所有需要耗费大量脑力进行代码验证、文献比对和格式撰写的“学术苦力活”，全部外包给 FARS 这样的自动化系统。

本质上FARS是一个科学家“助手”，而不是科学家。从前实验依赖于超级计算机，依赖于科学家编写的实验程序，现在有FARS或类似系统的参与，或许能够一定程度上提升科研的效率。