多智能体科研系统 FARS 深度技术分析报告
全称:FARS (Fully Automated Research System),即全自动科研系统 [1, 2, 3]。提出背景:该系统由上海日行迹智能科技有限公司(Analemma)发布,旨在颠覆传统的、类似“手工作坊”的科学发现模式,通过人工智能技术实现科研流程的规模化工业生产 [4, 5]。FARS团队认为,理想的研究系统应以“高效、可靠地拓展知识边界”为第一性原理,其产出应是包含“一个清
多智能体科研系统 FARS 深度技术分析报告
报告日期:2026年02月13日
一、基础信息
(一)系统定义与背景
- 全称:FARS (Fully Automated Research System),即全自动科研系统 [1, 2, 3]。
- 提出背景:该系统由上海日行迹智能科技有限公司(Analemma)发布,旨在颠覆传统的、类似“手工作坊”的科学发现模式,通过人工智能技术实现科研流程的规模化工业生产 [4, 5]。FARS团队认为,理想的研究系统应以“高效、可靠地拓展知识边界”为第一性原理,其产出应是包含“一个清晰的假设”和“对该假设的可靠验证”的知识单元,无论验证结果是正面还是负面 [6, 7]。
(二)研发团队与核心成员
- 发布团队:上海日行迹智能科技有限公司(Analemma),一家由复旦大学对话式大型语言模型MOSS团队核心成员发起的人工智能基础技术公司 [4, 8]。
- 创始人与核心作者:孙天祥博士,复旦大学计算机博士,师从复旦大学教授黄萱菁与邱锡鹏。他是国内首个开源对话式大模型MOSS的主要研发者 [4, 9]。孙天祥长期研究机器学习、自然语言处理与大模型体系,在ICML、ACL等AI顶会发表多篇论文,谷歌学术引用超4200次 [9]。
- 团队构成:团队约15人,研究团队占一半,核心成员来自复旦MOSS团队和书生(InternLM)大模型项目,平均年龄不足30岁 [9, 10, 11]。
(三)发布信息与开源地址
- 发布时间:系统于2026年2月12日正式发布 [2, 3]。
- 公开形式:发布次日(2月13日)在官网进行首次公开直播部署,目标是在约一个月内,从9个预设AI研究方向出发,自主生成100篇科研论文 [9, 12]。
- 官方网站:
analemma.ai[9]。 - 开源地址:所有产出(包括论文和代码)通过其GitHub账号实时公开:
github.com/fars-analemma[9, 13]。
(四)核心问题与定位区别
- 核心解决问题:旨在无人类干预的情况下,纯AI驱动、端到端地自动化完成从“文献调研、假设生成”到“实验执行、论文撰写”的完整科研流程,将科学发现转变为可规模化、可复现的工业生产过程 [6, 14]。
- 定位区别:
- 与生产力工具对比:日行迹的另一款产品Lemma定位为“辅助驾驶”的生产力工具,而FARS则定位为“自动驾驶”的基础设施,追求完全的自主性 [9]。
- 与传统多智能体框架对比:
- AutoGen, CrewAI, MetaGPT, LangGraph等框架通常作为“工具包”或“SDK”,供开发者构建定制化的多智能体应用 [15, 16, 17]。它们提供的是构建块和协作模式(如角色扮演、对话协商、图状流程控制)。
- FARS则是一个完整的、端到端的“应用系统”。它不是一个供二次开发的框架,而是直接面向“自动化科研”这一特定任务的成品。其内部虽然也采用多智能体架构,但用户与之交互的是整个系统,而非单个智能体或框架API [6, 9]。
二、系统架构与技术原理
(一)系统整体架构设计
FARS被设计为一个端到端的、纯AI驱动的多智能体系统(Multi-Agent System, MAS)。其架构围绕科研流程的四个核心阶段构建,通过模块化的智能体分工与协作,实现全流程自动化 [6, 18]。
[预设研究方向/用户输入] | V ±--------------------------------------------------+ | FARS 核心系统 | | | | ±----------------+ ±----------------------+ | | | Ideation Agent |–>| Planning Agent | | | | (构思智能体) | | (规划智能体) | | | ±----------------+ ±----------------------+ | | ^ | | | | (反馈/迭代) V | | ±----------------+ ±----------------------+ | | | Writing Agent |<–| Experiment Agent | | | | (写作智能体) | | (实验智能体) | | | ±----------------+ ±----------------------+ | | | | ±----------------------------------------------+ | | | 共享文件系统 (Shared File System) | | | | (作为工作空间 & 持久记忆) | | | ±----------------------------------------------+ | | | | ±----------------------------------------------+ | | | 统一调用端口 (Unified API Port) | | | ±----------------------------------------------+ | | | | | | V V | | [闭源/开源大模型] [GPU集群(160卡)] | | (e.g., GPT, Llama, Qwen) (用于训练/推理) | ±--------------------------------------------------+ | V [输出: 科研论文 (上传至arXiv) & 实验代码 (提交至GitHub)]
- 核心组成:系统由四个专门的智能体模块构成,它们通过一个共享文件系统进行协作 [6, 19]。
- 基础设施:为了支持智能体运行,团队为FARS配置了强大的基础设施,包括一个由160张GPU组成的集群(包装为训练和推理工具供智能体调用),以及一个能够调用几乎所有主流闭源和开源大模型的统一端口 [19, 20]。
- 工作空间与记忆:共享文件系统是整个系统的中枢,不仅作为各智能体的工作空间,传递中间产物(如文献综述、实验方案、代码、结果数据),还承担了持久记忆的功能,记录整个研究过程的轨迹 [19]。
(二)多智能体协作机制
- 角色分工 (Role-based):FARS明确采用了角色驱动机制,每个智能体被赋予了与科研流程特定阶段相匹配的清晰职责 [18, 21]。这种设计类似于CrewAI等框架的理念,但FARS将其固化为一个完整的端到端系统 [22]。
- Ideation (构思)智能体:负责根据预设的研究方向,不间断地自动进行文献调研和假设(Hypothesis)生成。这是科研流程的起点,决定了研究的创新性和方向 [6, 18]。
- Planning (规划)智能体:接收Ideation智能体生成的假设,并负责设计详细的实验方案以验证该假设 [18, 21]。
- Experiment (实验)智能体:根据Planning智能体制定的方案,负责编写代码、执行实验、合成数据并分析结果 [18, 21]。它通过统一端口调用GPU集群等计算资源 [19]。
- Writing (写作)智能体:整合前序所有阶段的产出(假设、方法、实验结果、分析),最终撰写成一篇完整的学术论文 [18, 21]。FARS团队特别强调,论文形式为聚焦单一贡献的短文,并且会报告负面结果,以此构成“最小可组合的知识单元” [7]。
- 通信机制:智能体之间的通信是异步的,通过共享文件系统进行。前一个智能体完成任务后,将其产出(如假设文档、实验计划文件、代码脚本、结果数据)存入共享文件系统,后一个智能体读取这些文件作为输入,继续下一步工作。这种机制解耦了各个智能体,使它们可以独立工作和迭代 [19]。
- 调度方式:FARS采用的是一种线性的、流水线式(Pipeline)的调度方式。一个假设在通过Ideation智能体的自动化评估后,会被依次交由Planning、Experiment和Writing智能体处理,形成一个闭环的科研流程 [19]。系统可以并行处理多个不同的假设,每个假设在自己的流水线中独立推进。
(三)推理流程与任务执行流程
FARS的整个工作流程体现了从抽象想法到具体成果的转化过程,其核心是“假设驱动”。
- 启动:系统从一个或多个预设的研究方向开始(例如,直播中预设了AI领域的9大热点方向)[9]。
- 构思与假设:Ideation智能体持续扫描相关文献(可能通过API访问学术数据库),识别研究空白,并自主生成新的、可验证的科学假设。
- 自动化评估:生成的假设会经过一个自动化评估环节,以判断其价值和可行性,通过后才进入下一阶段 [19]。
- 规划实验:Planning智能体为通过评估的假设设计实验,定义所需的模型、数据、代码实现和评估指标。
- 执行与编码:Experiment智能体接收实验计划,调用大模型(如代码生成模型)编写实验代码,并利用GPU集群执行代码,收集实验数据和结果。
- 撰写与发布:Writing智能体将整个过程——从假设、方法论到实验结果和结论——综合撰写成一篇结构化的短篇论文。
- 人工审核与发布:为保证质量,FARS生成的每篇论文在上传至arXiv前,会经过至少3位资深研究员的审核,并明确标注为AI生成 [9]。实验代码会实时提交到GitHub仓库 [19]。
(四)关键技术能力分析
- 角色驱动机制:是。这是FARS架构的核心,通过四个专业化的智能体(Ideation, Planning, Experiment, Writing)模拟了科研团队的分工协作 [18]。
- 规划与反思机制:是。
- 规划(Planning):系统中有专门的Planning智能体负责实验设计,这本身就是一种前瞻性的规划能力 [18]。
- 反思(Reflection):虽然资料未明确使用“Reflection”一词,但FARS的设计哲学体现了反思机制。例如,系统被设计为报告负面结果,这本身就是对失败实验的一种总结和学习 [7]。此外,类似Reflexion等框架中“从错误中学习”的理念,很可能内嵌于FARS的迭代循环中,例如,如果一个实验失败,系统可能需要反思原因并调整方案。其“回到科研基本单元”的理念,即“一个清晰的假设+可靠验证”,本身就蕴含了对每一步进行评估和确认的循环过程 [9]。
- 工具调用系统:是。FARS接入了统一的调用端口,使其能够调用几乎所有闭源和开源模型(如GPT系列、Llama系列等)以及一个包含160张GPU的计算集群。这些外部模型和计算资源可以被视为FARS智能体调用的“工具” [10, 19]。
- 长期记忆或知识库:是。共享文件系统不仅是任务流转的工作区,也扮演了持久记忆(Persistent Memory)的角色 [19]。它记录了从假设到论文产出的全过程,使得系统可以追溯历史,也可能为未来的研究提供上下文。这类似于AI Agent领域中利用外部数据库(如向量数据库)实现长期记忆的思路 [23]。
- 自主决策能力:是。FARS被设计为“无人类干预”的纯AI驱动系统 [6]。从选择研究假设、设计实验方案到编写代码,每一步都由智能体自主决策。系统甚至被允许自由探索预设研究方向之外的课题,展现了高度的自主性 [9]。
- 与MOSS模型的关系:FARS是由MOSS核心研发成员创立的公司推出的产品,但它本身是一个多智能体“系统”或“框架”,而非一个特定的“模型” [4, 9]。MOSS是对话式大语言模型,而FARS则是一个更高层次的架构,它会“调用”像MOSS、GPT-4、Llama等多种大模型作为其智能体的大脑或工具来完成任务 [19]。可以理解为,MOSS是FARS可能使用的众多基础模型之一。
三、功能与应用场景
(一)支持的任务类型
- 核心任务:端到端的自动化科学研究。具体分解为以下子任务:
- 文献调研与综述生成:Ideation智能体自动进行文献检索和分析 [6]。
- 科学假设提出:基于文献分析,自主生成新的研究假设 [6]。
- 实验设计与规划:Planning智能体自动创建实验流程和方案 [18]。
- 代码编写与执行:Experiment智能体自动编写和运行实验代码 [18]。
- 数据分析与可视化:实验产生的数据由系统自动处理和分析。
- 学术论文撰写:Writing智能体将所有结果整合成结构化的论文 [6]。
- 当前聚焦领域:目前,FARS主要聚焦于“用AI研究AI”(AI4AI)领域 [9]。这是一个务实的选择,因为AI领域的实验可以完全在计算机上完成,无需物理设备,天然适合自动化。
(二)典型应用场景
- AI领域自动化科研:这是FARS当前最直接的应用场景。官方直播演示即围绕AI领域的九大前沿热点展开,包括:
- 强化学习(RLVR)
- 小语言模型后训练
- LLM自动化评估
- 超越Transformer的模型架构
- 持续学习
- 扩散语言模型
- AI Agent记忆机制
- 测试时计算缩放(Test-Time Scaling)
- 世界模型 [9]
- 潜在应用场景:虽然目前聚焦于AI,但其方法论具备扩展潜力。
- 计算科学:如计算生物学、计算化学、金融建模等,这些领域的实验主要依赖于模拟和计算,与FARS的现有能力匹配度高。
- 软件开发:FARS的“规划-编码-实验”流程与软件开发周期高度相似。理论上可以应用于自动化软件模块设计、功能实现、测试用例生成和技术文档撰写。
- 数据分析报告生成:对于需要深度数据分析并形成报告的商业场景,FARS的流程(提出假设-实验验证-撰写报告)可以被改造用于自动化生成市场分析、用户行为研究等报告。
(三)官方演示案例
- “FARS-100”公开直播项目:这是FARS发布后最引人注目的官方演示。
- 目标:在一个月内,从零开始,在公众面前实时进行AI科研,目标是产出100篇AI领域的学术论文 [9]。
- 过程透明:所有产出的论文和代码都通过官方GitHub账号(
fars-analemma)实时公开,确保了过程的可复现性和结果的可检验性 [9, 19]。 - 意义:团队认为,通过“规模化”的连续产出,才能充分暴露系统的真实能力,而非几篇精选的样本。这也是对自身系统能力的一次极限压力测试和公开评估 [9]。
(四)优势与局限
1. 优势
- 高度自主性与端到端整合:FARS是目前少数宣称能实现从想法到论文全流程自动化的系统之一,整合度非常高,减少了人工干预的需求 [6]。
- 回归科研第一性原理:FARS的设计理念跳出了传统“为发表而写论文”的框架,回归到“假设+验证”的科研基本单元,并重视负面结果的价值,这有助于产出更纯粹、更扎实的知识增量 [7, 9]。
- 规模化与效率:其目标是将科研从作坊模式提升至工业化生产,有望大幅提升知识发现的效率和规模,解决科研领域“反复造轮子”等问题 [7, 14]。
- 透明与可复现性:通过公开直播和实时代码提交,FARS展示了极高的透明度,所有产出都可被社区公开评审和复现,这在AI科研工具中是开创性的 [9, 19]。
2. 局限
- 领域局限性:目前仅聚焦于AI4AI,距离“AI做所有学科的科研”这一宏大愿景还有很远距离。其能力尚未在需要物理实验(如生物、化学)或复杂社会科学研究的领域得到验证 [9]。
- 算力依赖性强:系统运行依赖庞大的计算资源(如160张GPU的集群),这使得个人或小型团队难以复现其完整能力 [19]。FARS也明确表示暂时无法进行大规模预训练等极度消耗算力的实验 [9]。
- 无法进行需人类参与的实验:系统无法完成需要人工标注、专家评估或人类被试参与的实验,这限制了其在人机交互、心理学、社会学等研究领域的应用 [9]。
- 产出质量待验证:尽管有内部审核机制,但AI生成的百篇论文的整体学术质量、创新性和实际影响力,仍需时间和学术界的广泛检验。其竞品AI Scientist就曾因产出质量不佳而受到批评 [9]。
四、使用方式与开发流程
(一)开源状态与代码仓库
- 开源状态:FARS系统本身的核心代码目前尚未完全开源。其运作模式更接近于一个由日行迹公司运营的、公开展示其能力的SaaS(软件即服务)或PaaS(平台即服务)平台。
- 产出开源:项目的产出是完全开源的。在“FARS-100”直播活动中,所有由系统生成的论文和相关实验代码都实时公开在官方GitHub仓库中 [9, 19]。
- GitHub仓库地址:
https://github.com/fars-analemma[13]。该仓库主要用于发布FARS系统的研究成果,而非系统本身的源代码。
(二)安装与运行环境要求
- 安装方式:由于系统未开源,目前没有提供公开的安装包或安装指南。用户无法像使用开源框架(如AutoGen、LangChain)那样通过
pip install等命令进行本地安装 [24, 25]。 - 运行环境:FARS运行在日行迹公司提供的强大云端基础设施上。根据披露信息,该环境至少包括:
- GPU集群:一个包含160张GPU的集群,用于模型训练和推理 [19]。
- 模型调用能力:能够接入并调用几乎所有主流的闭源(如OpenAI API)和开源(如Llama)大语言模型 [19]。
- 软件栈:推测其后端基于Python,并深度整合了多种AI框架和库,但具体技术栈未公开。
(三)快速启动与示例代码
- 快速启动步骤:目前没有提供给外部用户的“Quick Start”指南。公众参与FARS的方式是作为“观察者”和“评估者”:
- 访问FARS的官方直播页面(
analemma.ai/fars)观看系统实时运行状态 [9]。 - 访问其GitHub仓库(
github.com/fars-analemma)查阅、下载和复现已生成的论文和代码 [9]。 - 参与学术社区对这些产出物的讨论和评审。
- 访问FARS的官方直播页面(
- 示例代码说明:GitHub仓库中的代码即为FARS系统的“示例”。这些代码是Experiment智能体为验证特定科学假设而生成的,通常是完整的、可运行的Python项目。用户可以克隆这些仓库,搭建相应的Python环境(如创建虚拟环境并安装
requirements.txt中的依赖),来复现论文中的实验结果 [26]。
(四)接口与扩展支持
- Python API:不提供。FARS作为一个闭源的端到端系统,目前没有向公众开放其内部的Python API供二次开发或集成 [27]。
- CLI(命令行界面):不提供。没有公开的CLI工具用于与FARS系统交互、提交任务或管理其运行 [28]。
- Web UI:提供(用于展示)。FARS提供了一个面向公众的Web界面,但其功能是展示系统实时的工作状态、研究进展和产出列表,而非一个可供用户操作的交互式开发或使用界面 [9]。
- 插件扩展:不支持(对外部用户)。系统内部可能通过模块化设计支持功能扩展(如增加新的工具或智能体),但没有为第三方开发者提供插件机制或扩展接口 [29]。
五、本地部署可行性评估(重点)
(一)是否支持本地部署
- 结论:目前完全不支持。FARS是一个由日行迹公司集中部署和运营的闭源系统,其核心架构、智能体逻辑和协调机制均未开放。用户无法获取源代码或部署包在本地服务器或个人电脑上运行 [9, 19]。
(二)云端依赖与离线运行
- 云端API依赖:高度依赖。FARS的设计核心是调用各种外部大模型API(包括闭源的如GPT系列和开源的托管模型)作为其智能体的“大脑” [19]。即使未来部分组件开源,若要达到官方展示的性能,也无法脱离对这些强大云端模型的调用。
- 离线运行可行性:极低。要实现完全离线运行,需要满足以下苛刻条件,目前来看几乎不可能:
- 获取FARS的全套源代码和部署方案。
- 在本地部署一套性能足够强大的基础大模型(如70B+参数规模),以替代FARS对外部API的调用。
- 拥有一套强大的本地GPU集群(官方配置为160块GPU)来支撑这些本地模型的推理和实验任务的运行 [19]。
(三)支持的本地模型
- FARS系统本身作为调用方,其架构设计上是模型无关的(Model-Agnostic)。通过其“统一调用端口”,理论上可以支持任何提供API接口的大模型,无论是云端的还是本地部署的 [10, 19]。
- 如果一个企业或个人希望在自己的环境中复现FARS的“工具”部分(即本地LLM),可以部署以下模型:
- MOSS:作为团队的“亲生”模型,理论上最有可能被优先集成,但需要相应的硬件支持 [30]。
- Llama系列 (如Llama 3):作为业界领先的开源模型,是本地部署的热门选择。运行70B模型至少需要2块高端消费级GPU(如RTX 4090 24GB)或1块专业级GPU(如A100 80GB)[31, 32]。
- Qwen系列 (如Qwen2):同样是性能强大的开源模型系列,硬件需求与Llama相当,是另一个可行的本地模型选项 [33, 34]。
- 其他开源模型:如Mistral, DeepSeek等,只要能通过Ollama, vLLM, llama.cpp等框架部署并提供兼容OpenAI的API接口,理论上都能被类似FARS的系统集成 [32]。
(四)硬件要求评估
由于FARS本身无法本地部署,此处评估的是“若要搭建一套能力接近FARS的本地化AI科研系统”所需的硬件配置。
- 最低入门级(用于实验/学习,性能受限):
- CPU:现代多核CPU(如Intel i7 / AMD R7及以上)。
- 内存:64GB RAM。
- GPU:单张NVIDIA RTX 3090 / 4090 (24GB VRAM)。
- 能力:可以运行一个经过4-bit量化的30B-70B参数规模的LLM作为核心推理引擎,同时处理一些小规模的实验任务。但无法支撑多智能体并行和大规模实验 [31, 35]。
- 企业级推荐配置(用于生产/研究):
- CPU:服务器级多核CPU。
- 内存:256GB+ RAM。
- GPU:多卡服务器,至少配备4-8块NVIDIA A100/H100 (80GB VRAM) 或同等级别的专业GPU。
- 能力:可以较为流畅地运行多个70B+参数的大模型,支持多智能体并行工作,并为代码实验提供充足的计算资源。这更接近FARS官方配置的“缩减版” [36]。
- FARS官方级别(用于大规模自动化科研):
- GPU:160块GPU组成的集群 [19]。这种规模的算力通常只有大型科技公司或国家级实验室才能负担。
(五)本地部署难度与企业私有化分析
- 本地部署难度:极高/不可能。在FARS官方不提供部署方案的情况下,自行从零复刻一套功能对等的系统,涉及复杂的系统设计、多智能体协同、工具链集成和大规模硬件管理,对绝大多数团队而言是不现实的。
- 企业私有化部署可行性:
- 当前状态:不可行。因为日行迹公司并未提供私有化部署的商业选项。
- 未来可能性:对于数据高度敏感、算力资源雄厚的大型企业(如制药、金融、半导体),如果日行迹未来推出私有化部署方案,将具有很强的吸引力。企业可以利用FARS的自动化科研能力,在内部数据和知识库上进行研究,加速创新。
- 数据安全与隐私优势(假设可私有化部署):
- 如果FARS能够实现完全的本地化部署(包括本地模型),其数据安全优势将非常显著。所有研究数据、中间过程和最终成果都将保留在企业内网,不会传输到任何外部服务器,完全避免了通过公有云API传输敏感数据带来的泄露风险 [37]。这对于涉及商业机密或受严格监管的行业至关重要。
六、与同类框架对比分析
FARS作为一个端到端系统,与AutoGen、CrewAI、MetaGPT、LangGraph等“框架”在定位上有所不同。此处对比的是它们在构建多智能体应用时所体现出的架构哲学和能力特点。
维度
FARS (系统)
AutoGen
CrewAI
MetaGPT
LangGraph
架构设计
固定的四阶段流水线式多智能体架构,为“科研”这一特定任务高度优化 [18]。
以“对话”为核心,智能体通过消息传递进行协作和协商,支持灵活的对话模式和人类参与 [38, 39]。
以“角色扮演”为核心,智能体被赋予明确的角色、目标和工具,通过顺序或层级化流程协作,心智模型清晰 [22, 40]。
高度结构化的“软件公司”模拟,智能体扮演产品经理、架构师等角色,遵循标准操作流程(SOP)产出文档和代码 [41, 42]。
以“状态图”为核心,将工作流建模为图形,节点是智能体或工具,边是逻辑转换。支持循环、分支和持久化状态,控制力强 [17, 43]。
易用性
对最终用户(观察者)极简,无需编程。对开发者而言,系统是黑盒,无法使用 [9]。
学习曲线中等。需要理解其对话驱动的编程模型,但文档和社区支持良好 [44, 45]。
易用性高,对初学者友好。角色和任务的定义直观,能快速搭建原型 [40, 46]。
易用性较高,只需一个高层指令即可生成完整项目。但因其高度结构化,定制化较难 [41]。
学习曲线较陡。需要开发者具备图论和状态机的思维模式,更偏向底层和灵活,但对新手不友好 [46, 47]。
扩展能力
对外部用户不具备扩展性。内部通过统一端口调用工具,理论上可扩展 [19]。
扩展性强。可以自定义智能体行为、工具和对话模式,灵活性高 [39]。
扩展性良好。可以方便地为智能体添加自定义工具,但协作流程相对固定(顺序/层级)[22]。
扩展性有限。其SOP流程是固化的,适合特定任务(软件开发),不易泛化到其他领域 [41]。
扩展性极强。作为低级框架,几乎可以构建任何复杂的控制流,并与LangChain生态无缝集成 [17, 43]。
自主性水平
极高。设计目标就是全流程自主,无需人类干预,甚至可以探索未知课题 [6, 9]。
高。支持自主对话和代码执行,但通常需要人类设定初始目标和参与关键决策(Human-in-the-loop)[39]。
中到高。智能体在角色范围内自主执行任务,但整体流程由预设的任务序列驱动 [22]。
高。在预设的软件开发流程内高度自主,但无法跳出该框架。
可配置。自主性水平取决于开发者如何设计图的结构,可以实现从简单工作流到高度自主的循环、反思代理 [43]。
本地部署能力
不支持。完全依赖云端部署和API [9]。
支持。作为Python框架,可以完全在本地部署,并连接本地运行的LLM [38]。
支持。与AutoGen类似,可以本地部署并使用本地模型 [22]。
支持。可以本地安装运行,并配置使用本地或远程LLM。
支持。作为LangChain的扩展,完全支持本地化部署 [17]。
企业应用潜力
巨大(若开放)。其工业化科研的理念对研发密集型企业(如制药、材料)极具吸引力。目前作为技术展示,尚未商业化。
高。灵活性和微软背景使其在企业定制化AI助手、复杂问题解决等场景中应用广泛 [39, 48]。
高。直观的角色模型易于业务人员理解,适合快速构建内容生成、市场分析、客户服务等工作流自动化应用 [40, 48]。
中等。在软件工程自动化领域潜力巨大,但应用场景相对垂直 [41]。
极高。其强大的控制力和可靠性使其成为构建生产级、可审计、高容错的企业级Agent应用的理想选择,尤其在金融、合规等领域 [43, 48]。
七、发展现状与生态
(一)社区活跃度
- GitHub表现:FARS的官方GitHub仓库 (
fars-analemma) 是一个成果发布平台,而非开源项目协作区。因此,传统的社区活跃度指标(如Stars, Forks, Contributors, Issues)在此处不适用 [13, 49]。其关注度主要体现在社区对其产出论文的引用和讨论上。 - 媒体与社区讨论:FARS的发布引发了科技媒体(如36氪、新浪科技)和AI社区的广泛关注和报道 [4, 9, 19]。其独特的公开直播形式和宏大目标(100篇论文)成为了讨论热点。团队预测,FARS的引用量将在2026年底超过其所有创造者,这反映了他们对系统产出影响力的信心 [10, 11]。
- 对比:相比之下,AutoGen、CrewAI等开源框架拥有数万的GitHub Stars和活跃的贡献者社区,生态更为成熟和开放 [22, 39, 50]。
(二)实际落地案例
- 核心案例:“FARS-100”项目本身就是其目前唯一的、最大规模的公开落地案例 [9]。它旨在通过实践证明其“自动化科研”的能力。
- 商业应用:截至报告撰写时,尚未有公开信息表明FARS已被其他企业或机构用于商业化的科研项目。目前,它更多地是日行迹公司展示其技术实力和未来愿景的旗舰项目。
- 质量控制:FARS团队对产出质量有严格把控,生成的论文需经内部资深研究员审核,且不打算投稿传统学术会议,而是更关注论文的实际引用和价值,并邀请同行评审 [9]。这表明其当前阶段更侧重于探索和验证,而非追求传统学术指标。
(三)开发者生态与文档
- 开发者生态:由于FARS是闭源系统,目前没有形成外部开发者生态。开发者无法基于FARS进行二次开发、创建插件或贡献代码。其生态主要由内部研发团队构成 [9]。
- 文档完善程度:没有提供面向开发者的公开技术文档、API参考或教程。相关信息主要来源于官方博客、发布会和媒体报道 [1, 9]。相比之下,AutoGen、LangChain等框架拥有极其详尽的官方文档和丰富的社区教程 [44, 51]。
(四)未来发展方向与研究趋势
- 从AI4AI到AI for Science:FARS目前聚焦于AI领域是务实的第一步。其长远目标必然是向更广泛的科学领域(AI for Science)拓展,如计算生物、材料科学、物理学等。团队也承认,AI4AI是当前阶段的选择,而非方法论本身的限制 [9]。
- Agent能力的深化:
- 更强的规划与反思能力:未来的FARS可能会集成更先进的规划算法(如基于树搜索的策略,类似AI Scientist v2)和更明确的反思机制(如Reflexion),以提高研究的深度和原创性 [9, 52]。
- 多智能体协作的演进:可能会从当前的线性流水线演变为更复杂的协作模式,如动态任务分配、智能体间的辩论与协商,以应对更复杂的研究问题 [38, 53]。
- 与人类研究员的协同:虽然FARS追求全自主,但未来的发展方向可能是构建人机协同的科研平台,AI负责大规模的探索和验证,人类专家则负责提出更具创造性的宏大构想和进行最终的价值判断。
- 行业趋势:FARS的出现顺应了“AI for Science”从“助手(Copilot)”向“科学家(Scientist)”角色迁移的宏观趋势。包括OpenAI、DeepMind、智源研究院在内的顶尖机构都在布局全自主的AI研究员,这是一个全球性的前沿竞赛 [9]。FARS作为中国的第一个公开实验,其进展备受关注。
本地部署可行性结论
综合评估,FARS(Fully Automated Research System)目前完全不具备本地部署的可行性。
它是一个由其开发公司(日行迹)在云端集中化部署和运营的闭源系统。其核心功能高度依赖大规模的私有GPU集群(160块GPU)和对多种闭源及开源大模型API的实时调用。因此,个人开发者或绝大多数企业无法获取其源代码,也无法在本地环境中复现其运行所需的软硬件基础设施。对于希望实现类似功能的企业,唯一的路径是自行研发或等待日行迹未来可能推出的私有化部署商业方案。
综合评价:是否值得企业或个人部署使用
对于个人开发者:
不值得(也无法)部署使用。 个人开发者应将FARS视为一个前沿技术趋势的观察对象和灵感来源。可以关注其GitHub仓库发布的论文和代码,学习其研究思路和实验方法,并尝试在本地使用AutoGen、LangGraph等开源框架,结合本地运行的小型LLM,复现或构建小规模的自动化工作流,作为学习和探索。但期望在个人设备上运行FARS本身是不现实的。
对于企业:
- 普通企业:不值得部署。 对于大多数没有海量算力资源和顶尖AI研发团队的企业,自行构建一套类FARS系统成本过高,且FARS也未提供可直接使用的产品。更务实的选择是利用CrewAI、AutoGen等成熟框架,结合云服务或本地部署的LLM,构建针对特定业务场景(如报告生成、数据分析、内容创作)的自动化流程。
- 研发密集型大型企业(如制药、金融、高科技):值得高度关注,等待商业化方案。 FARS所代表的“科研工业化”理念,对这些需要通过大规模研发来维持竞争优势的企业具有颠覆性的潜力。一旦日行迹推出成熟、可靠的私有化部署方案或企业级云服务,这些企业将是其核心目标客户。通过部署FARS,它们有望在保障数据安全的前提下,极大地加速内部的研发创新、知识发现和专利产出。
总体而言,FARS目前是一个“技术灯塔”式的项目,其象征意义和探索价值大于直接的实用价值。它展示了AI Agent技术在科研领域的终极潜力,但距离成为普惠性的工具或可部署的产品还有很长的路要走。
参考文献
- [1] Analemma. (2026, Feb 10). *Introducing FARS*. analemma.ai.
- [2] 每日经济新闻. (2026, 02-13). *由复旦大学MOSS团队核心成员创办于去年3月的AI初创公司上海日行迹智能科技有限公司2月12日发布多智能体系统FARS*. finance.sina.cn.
- [3] 东方财富网. (2026, 02-13). *由复旦大学MOSS团队核心成员创办于去年3月的AI初创公司上海日行迹智能科技有限公司2月12日发布多智能体系统FARS*. caifuhao.eastmoney.com.
- [4] 新浪科技. (2026, 02-13). *复旦MOSS团队核心成员发布全新多智能体系统,可自动完成“从文献调研到论文撰写”科研全流程*. finance.sina.com.cn.
- [5] 科学网. (2026, 2月). *复旦MOSS团队核心成员发布全新多智能体系统*. news.sciencenet.cn.
- [6] 搜狐. (2026). *FARS (Fully Automated Research System) 是一个无人类干预、纯AI 驱动的端到端研究系统*. sohu.com.
- [7] 新浪看点. (2026). *FARS 团队认为,这些问题是由以人为中心的研究系统的固有特性带来的*. k.sina.com.cn.
- [8] 科学网. (2026, 2月). *日行迹是由复旦大学对话式大型语言模型MOSS团队核心成员发起的人工智能基础技术公司*. news.sciencenet.cn.
- [9] 36氪. (2026). *复旦MOSS团队核心成员发布全新多智能体系统,可自动完成“从文献调研到论文撰写”科研全流程*. 36kr.com.
- [10] 科学网. (2026, 2月). *为了让FARS能够顺利合成数据、设计智能体等,FARS接入了统一调用端口*. news.sciencenet.cn.
- [11] 机器之心. (2026, 2月). *日行迹研究团队成员平均年龄不足 30 岁*. 36kr.com.
- [12] 新浪看点. (2026). *明天上午11点,FARS的直播将在analemma.ai/fars上线*. k.sina.com.cn.
- [13] GitHub. *fars-analemma*. github.com.
- [14] 搜狐. (2026). *构建一个怎样的系统,才能让 AI 自我迭代的飞轮真正转起来?*. sohu.com.
- [15] Medium. (2026). *Top 9 AI Agent Frameworks in 2026*. medium.com.
- [16] Turing.com. (2026). *AI Agent Frameworks: A Comparative Guide*. turing.com.
- [17] IBM. *What is LangGraph?*. ibm.com.
- [18] 新浪科技. (2026, 02-13). *FARS由Ideation、Planning、Experiment、Writing四个智能体模块构成*. finance.sina.com.cn.
- [19] 机器之心. (2026, 2月). *团队一次性投入了一个包含 160 张 GPU 的集群*. 36kr.com.
- [20] 新浪看点. (2026). *团队也为 FARS 提供了统一的调用端口,使得 FARS 能够调用几乎所有闭源和开源模型*. k.sina.com.cn.
- [21] 36氪. (2026). *技术架构上,FARS是一个多智能体系统,由四个模块构成*. 36kr.com.
- [22] Arsum. (2026, Feb 5). *AI Agent Frameworks: A Comprehensive Comparison*. arsum.com.
- [23] Neo4j. *Meet Lenny’s Memory: Building Context Graphs for AI Agents*. neo4j.com.
- [24] Google Cloud. *What is a multi-agent system?*. cloud.google.com.
- [25] Neurons Lab. (2026). *How to build a multi-agent AI system for finance*. neurons-lab.com.
- [26] Samuel Dowling. (2020, Jun 8). *How to set up a Python project and development environment*. samueldowling.com.
- [27] GitHub. *Open WebUI Discussions*. github.com.
- [28] GitHub. *OpenFaaS CLI*. github.com.
- [29] Martin Fowler. *Function Calling in LLMs*. martinfowler.com.
- [30] Qiu, X., et al. (2023). *MOSS: An Open Conversational Large Language Model*. arXiv.
- [31] like2byte.com. (2026). *GPU VRAM for 30B LLM Guide 2026*. like2byte.com.
- [32] Intuition Labs. (2026). *Local LLM Deployment: 24GB GPU Optimization*. intuitionlabs.ai.
- [33] Praveena, A. (2026). *Llama or Qwen Architecture? Wondering what’s what?*. medium.com.
- [34] Tabnine. *Beyond Model Selection: True Architectural Freedom for Enterprise AI Software Development*. tabnine.com.
- [35] Novi AI. (2026). *Best GPU for AI Video Generation*. noviai.ai.
- [36] NVIDIA. *Custom Deployment Guide*. docs.nvidia.com.
- [37] CertLibrary. *Comparing Cloud-based vs. Local Deployment of Large Language Models (LLMs)*. certlibrary.com.
- [38] Microsoft. *AutoGen*. devblogs.microsoft.com.
- [39] Arsum. (2026, Feb 5). *AI Agent Frameworks: A Comprehensive Comparison*. arsum.com.
- [40] O-MEGA.AI. (2026). *LangGraph vs. CrewAI vs. AutoGen: Top 10 Agent Frameworks 2026*. o-mega.ai.
- [41] Medium. (2025). *The 4 Best Open-Source Multi-Agent AI Frameworks in 2025*. medium.com.
- [42] Reddit. *LangGraph vs Crew AI vs AutoGen vs MetaGPT*. reddit.com.
- [43] Comet. *Multi-Agent Systems: Architecture, Design Patterns, State Management, and Evaluation*. comet.com.
- [44] DataCamp. *CrewAI vs LangGraph vs AutoGen: A Deep Dive*. datacamp.com.
- [45] Medium. (2026). *Comprehensive Comparison of AI Agent Frameworks*. medium.com.
- [46] Medium. *First-hand comparison of LangGraph, CrewAI, and AutoGen*. aaronyuqi.medium.com.
- [47] LinkedIn. *AI Agent Frameworks in 2026: How to Choose, Build, and Scale Agentic Systems*. linkedin.com.
- [48] Automation Anywhere. *What are autonomous agents?*. automationanywhere.com.
- [49] GitHub. *REST API for community profile metrics*. docs.github.com.
- [50] Medium. (2026). *Top 10 Most Starred AI Agent Frameworks on GitHub (2026)*. techwithibrahim.medium.com.
- [51] LangChain Blog. (2026). *Reflection Agents*. blog.langchain.com.
- [52] Shinn, N., et al. (2024). *Reflexion: Language Agents with Verbal Reinforcement Learning*. arXiv.
- [53] Anthropic. (2025). *A multi-agent system for research*. anthropic.com.
更多推荐



所有评论(0)