众智FlagOS 1.6发布,以统一架构推动AI硬件、软件技术生态创新发展
通过进一步技术创新,加快生态使能、深化硬件架构感知、加速AI赋能研发,为自主算力生态的规模化成熟与产业化落地夯实基础
2026年1月5日,“2026北京人工智能创新高地建设推进会”在中关村国际创新中心举行。会上,北京智源人工智能研究院正式发布面向多种AI芯片的系统软件栈 —— 众智 FlagOS 1.6,并同步启动生态建设系列行动。直面硬件生态割裂、开发效率不足和应用落地难等行业痛点,众智FlagOS通过进一步技术创新,加快生态使能、深化硬件架构感知、加速AI赋能研发,为自主算力生态的规模化成熟与产业化落地夯实基础。
智源研究院副院长兼总工程师林咏华表示,FlagOS 1.6 推动 AI 系统软件迈入“一次开发、跨芯片运行、多框架支持”的新阶段,使开发者能够更专注于模型与应用创新。通过统一框架插件、算子自动生成、编译器新语言扩展、和FlagOS具身智能框架(FlagOS-Robo)等关键突破,FlagOS 正在整合算力与开源生态,加速 AI 从实验室走向规模化应用。

核心发布:FlagOS1.6能力全方位跃升
当下,人工智能从芯片到应用快速创新,AI芯片架构持续升级,3D堆叠、存算一体等新设计不断涌现,系统架构也进入以多样互联与混合算力为特征的超节点阶段。强化学习、世界模型、具身智能等方向推动模型持续迭代,随之而来的新型算子需求日益增长,开发工具与语言也需相应演进。AI智能体与具身智能等正成为应用创新的焦点。这些从芯片硬件到应用场景的快速演进,无一不对处于关键“中间位”,起到“承上启下”作用的AI系统软件提出了更多的技术需求和更大的创新挑战。
为了应对这样的技术新趋势,众智FlagOS专注于加快生态使能、深化架构感知、加速AI赋能的创新,推出FlagOS 1.6 为开发者提供更易适配、更高性能、更快迭代的一体化工具链,同时支持具身智能模型研发,推动AI开发模式从“适配硬件”转向“模型创新”。

框架FlagScale v1.0版本:一次开发,多芯运行
破解生态割裂的“NxM”难题,FlagOS从解决“N种芯片生态”的统一,进入解决“M种框架/算法包的接入”的下半程。FlagScale v1.0通过多芯片统一插件方式,对框架/算法包实现非侵入式修改,极大降低适配成本,助力大模型Day0支持,保持用户使用习惯,无缝获得跨芯一致性结果。该框架为各种AI软硬件厂商提供了统一、标准化的接入机制,有效解决以往生态分散、版本不一的困境。
KernelGen 1.0:全球首个支持多芯片的算子自动生成平台上线,开发进入“分钟级”
全球首个支持多种AI芯片的 Triton 算子自动生成平台 KernelGen 1.0 正式发布,突破传统 copilot 仅生成代码、不保证效果的局限,实现从需求理解、算子生成、正确性验证及加速比评测的全生命周期自动化。开发者一次描述即可完成生成与评测,全流程仅需 2 分钟,50% 生成算子在同等算力下性能达到或超过 CUDA 原生算子。基于 FlagOS 技术栈,KernelGen 1.0 已支持英伟达、摩尔线程、华为、海光、天数等多种芯片,实现跨芯片生成与多端验证,显著降低算子适配与优化成本,加速算子生态的规模化共建。
在 KernelGen 1.0 的辅助下,FlagGems总规模扩容至363个高质量算子,涵盖正式发布的230个算子,及首批机器自动生成的133个算子。FlagGems作为全球最大的 Triton 算子库,其中82%以上的Triton算子与CUDA原生算子性能平齐或超过,并已支持10多种AI芯片。
编译器FlagTree v0.4:探索Triton的新语言,让算子优化更简单
FlagTree升级推出Triton语言扩展(TLE)的预览版,通过分层设计在易用性与极致手写优化之间取得平衡,覆盖从初级到高级不同程度开发者的多样化需求。以中级开发者使用的基础原语扩展为例,关键算子性能提升超过 10%;在多芯片高效运行时,已支持 Nvidia、华为昇腾、摩尔线程和天数等平台,关键算子性能可进一步提升 20% 以上,大幅降低了多芯片适配与算子优化的技术门槛。
从数据到模型的落地路径,具身智能一体化工具链
本次推进会上,智源研究院以RoboBrain2.5为案例,展现了FlagOS作为国产软件栈,如何整合国产芯片、推进国产具身大脑基础模型RoboBrain2.5的研发。RoboBrain2.5 在全面继承2.0版本通用感知、空间推理和时序建模三大核心能力的基础上,通过融合更大规模、更高质量的训练数据集,于3D空间理解和时序价值预测两大维度实现了能力跃升。
为系统性地降低具身智能研发门槛高、技术链路长的挑战,FlagOS1.6专门推出FlagOS-Robo版本,覆盖数据加载、模型训练、推理到具身评测的全流程工具链,显著降低开发复杂度。基于此,智源同步上线RoboXStudio具身智能一站式平台,实现从具身数据采集、标注到模型训练的全链路贯通,大幅提升“数据-模型”的闭环迭代效率。通过标准化、自动化的体系化支持,该架构为具身智能的快速验证与规模化落地奠定基础,加速其从实验室走向产业应用。
生态共建:产学研用全面落地
实现技术突破的同时,众智FlagOS 生态建设也在持续推进。本次大会上,智源研究院理事长黄铁军代表研究院与多家重点企业机构达成生态合作,共同推动人工智能基础设施的规模化部署与产业化落地。
智源与焕新社区联合共建 “众智 FlagOS 创新试验场” ,支持基于FlagOS的模型研发部署、课程教学和应用大赛等各类研发实验与社区活动,促进FlagOS生态成熟;与浪潮信息联合面向万亿参数大模型推理场景展开联合优化,推出基于众智FlagOS的大模型推理优化方案,显著提升推理效率与性价比;与清微智能基于众智FlagOS打造可重构超节点标杆产品,实现FlagOS与4K可重构超节点的全面适配与深度部署;与软通动力基于众智FlagOS发布集成部署全栈创新方案,打造“软件服务包”。
众智FlagOS产业合作签约仪式,从左至右:浪潮集团副总裁、浪潮北京市公司总经理蒋永昌,中国移动集团首席科学家冯俊兰,北京智源人工智能研究院理事长黄铁军,清微智能CEO王博,软通集团首席AI官金亚东
会上还启动了FlagOS开放计算全球大赛,智源与合作方一起为全球算法英雄和工程技术高手搭建施展才华的舞台,携手推进开放计算生态发展。

由众智FlagOS社区、智源研究院、中国计算机学会(CCF)联合发起的“FlagOS开放计算全球大赛”正式启动,在Kaggle和魔搭双平台上线
面向未来,众智FlagOS 将坚持做面向多种AI芯片的系统软件栈,持续以开源开放为核心,汇聚全球产学研力量,构建统一、高效、可持续的 AI 软件与算力基础设施。我们诚挚地邀请全球的开发者、研究人员以及产业伙伴,关注并加入到FlagOS的开源建设中来,为智能时代构建一个更加坚实、开放的智算底座。
更多推荐



所有评论(0)