随着人工智能技术进入到全面落地应用阶段,端侧智能设备对于高能效、低时延、高灵活性的智能计算需求日益迫切。FPAI异构融合可编程智能芯片,单芯片集成SoC、NPU和FPGA三大核心,具备异构协同、高能效、可扩展、单芯片满足全流程计算需求等优势,已成为端侧人工智能应用的优选解决方案。

1. 产品概述

面向端侧智能应用场景,复旦微电子集团于近期推出了国产全新一代FPAI芯片--FMQL30TAI(以下简称“30TAI”)。该芯片内部集成了4核处理器系统(Processing System,PS),负责系统级控制与通用浮点计算;集成了全新一代诸葛架构神经网络处理器(Neural Processing Unit,NPU),原生支持Transformer,负责高效AI计算;集成125K的可编程逻辑(Programmable Logic,PL),负责传感器数据预处理和定制化功能扩展。通过异构协同,30TAI单芯片即可满足端侧智能应用全流程计算需求,包括预处理、AI推理和后处理三个阶段,具备集成度高、小型化、高能效、高可靠性等优势,搭配全自主设计软件工具链Icraft,可应用于智能传感器、智能算力子卡、可穿戴设备、多模态信息处理等场景。

2. 技术指标

产品名称

·FMQL30TAI

产品时间

·2025年Q4

SoC

·集成4核CPU,主频@1GHz

·VPU支持4K@30fps视频编解码(H.264/H.265等)

NPU

·诸葛架构,支持电源开关动态切换、支持自动时钟门控

·集成1个ZG330 iCore,主频@1GHz

·8TOPS@INT8,4TFLOPS@BF16/FP16,2TFLOPS@TF32

·iCore 支持CNN/RNN/Transformer等神经网络

FPGA

·Logic Cells:125K  ·DSP Slices:400  ·Block RAM:9.3Mb

·PCIE GEN2.0x4,4路GTX

DDR支持

·支持DDR3,速率1600Mbps

·PS侧 位宽32bit,1GB

·PL侧 位宽64bit,4GB

封装

·FCBGA676,27*27

功耗

·约8W

系统支持

·支持Ubuntu、多种国产操作系统等

·支持无OS,裸机部署开发智能应用

深度学习框架支持

·支持主流深度学习框架,Pytorch、Tensorflow、PaddlePaddle、ONNX等。

·通过软件工具链Icraft将框架模型编译转换成FPAI能够识别的数据格式(json&raw),用于芯片平台部署推理。

3. 性能表现

基于30TAI对几个典型神经网络主干部分进行速度测试,其性能表现如下所示。

关于30TAI运行更多神经网络性能测试数据请参考:

FMQL30TAI运行神经网络性能测试清单

4. 应用场景

30TAI单芯片集4核CPU、8T诸葛架构NPU和FPGA于一体,具备高集成、高能效、高精度、场景自适应等优势,可灵活适应不同端侧智能应用的需求,例如视觉质检、安防巡检、货舱监控、工业控制、智能家居、可穿戴设备和智慧物流等场景。同时30TAI的NPU原生支持Transformer,因此可部署先进的多模态神经网络,可应用于语音识别、信号识别、语义理解等场景。此外,30TAI支持FP16/BF16/TF32计算精度,TF32数值动态范围(指数位相同)与FP32一致,高精度的性能表现让30TAI可应用于自主决策、博弈对抗、轨迹预测等场景。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐