国产异构融合FPAI-FMQL30TAI芯片,端侧智能应用标准解决方案
复旦微电子推出新一代FPAI芯片FMQL30TAI,集成4核CPU、8TOPS NPU和125K FPGA,支持Transformer架构和多模态AI应用。该芯片具备异构协同、高能效(约8W)、高精度(支持FP16/BF16/TF32)等优势,单芯片即可完成端侧智能全流程计算。适用于工业控制、智能家居、可穿戴设备等多场景,2025年Q4量产。配套自主软件工具链Icraft,支持主流深度学习框架部署
随着人工智能技术进入到全面落地应用阶段,端侧智能设备对于高能效、低时延、高灵活性的智能计算需求日益迫切。FPAI异构融合可编程智能芯片,单芯片集成SoC、NPU和FPGA三大核心,具备异构协同、高能效、可扩展、单芯片满足全流程计算需求等优势,已成为端侧人工智能应用的优选解决方案。
1. 产品概述
面向端侧智能应用场景,复旦微电子集团于近期推出了国产全新一代FPAI芯片--FMQL30TAI(以下简称“30TAI”)。该芯片内部集成了4核处理器系统(Processing System,PS),负责系统级控制与通用浮点计算;集成了全新一代诸葛架构神经网络处理器(Neural Processing Unit,NPU),原生支持Transformer,负责高效AI计算;集成125K的可编程逻辑(Programmable Logic,PL),负责传感器数据预处理和定制化功能扩展。通过异构协同,30TAI单芯片即可满足端侧智能应用全流程计算需求,包括预处理、AI推理和后处理三个阶段,具备集成度高、小型化、高能效、高可靠性等优势,搭配全自主设计软件工具链Icraft,可应用于智能传感器、智能算力子卡、可穿戴设备、多模态信息处理等场景。

2. 技术指标
|
产品名称 |
·FMQL30TAI |
|
产品时间 |
·2025年Q4 |
|
SoC |
·集成4核CPU,主频@1GHz |
|
·VPU支持4K@30fps视频编解码(H.264/H.265等) |
|
|
NPU |
·诸葛架构,支持电源开关动态切换、支持自动时钟门控 |
|
·集成1个ZG330 iCore,主频@1GHz |
|
|
·8TOPS@INT8,4TFLOPS@BF16/FP16,2TFLOPS@TF32 |
|
|
·iCore 支持CNN/RNN/Transformer等神经网络 |
|
|
FPGA |
·Logic Cells:125K ·DSP Slices:400 ·Block RAM:9.3Mb |
|
·PCIE GEN2.0x4,4路GTX |
|
|
DDR支持 |
·支持DDR3,速率1600Mbps |
|
·PS侧 位宽32bit,1GB |
|
|
·PL侧 位宽64bit,4GB |
|
|
封装 |
·FCBGA676,27*27 |
|
功耗 |
·约8W |
|
系统支持 |
·支持Ubuntu、多种国产操作系统等 |
|
·支持无OS,裸机部署开发智能应用 |
|
|
深度学习框架支持 |
·支持主流深度学习框架,Pytorch、Tensorflow、PaddlePaddle、ONNX等。 |
|
·通过软件工具链Icraft将框架模型编译转换成FPAI能够识别的数据格式(json&raw),用于芯片平台部署推理。 |
3. 性能表现
基于30TAI对几个典型神经网络主干部分进行速度测试,其性能表现如下所示。

关于30TAI运行更多神经网络性能测试数据请参考:
4. 应用场景
30TAI单芯片集4核CPU、8T诸葛架构NPU和FPGA于一体,具备高集成、高能效、高精度、场景自适应等优势,可灵活适应不同端侧智能应用的需求,例如视觉质检、安防巡检、货舱监控、工业控制、智能家居、可穿戴设备和智慧物流等场景。同时30TAI的NPU原生支持Transformer,因此可部署先进的多模态神经网络,可应用于语音识别、信号识别、语义理解等场景。此外,30TAI支持FP16/BF16/TF32计算精度,TF32数值动态范围(指数位相同)与FP32一致,高精度的性能表现让30TAI可应用于自主决策、博弈对抗、轨迹预测等场景。
更多推荐



所有评论(0)