佳文赏读 || FSTA-SNN:基于频率的Spiking神经网络时空注意力模块 (2025AAAI会议)
选文提出了一种基于频率的时空注意力模块(FSTA)来优化脉冲神经网络(SNNs)的性能。研究发现SNNs在时空维度上存在特征学习冗余问题,尤其是浅层网络。通过离散傅里叶变换分析脉冲输出,发现其频率分布具有高度一致性。基于此,FSTA模块包含基于DCT的空间注意力子模块和时间注意力子模块,能有效抑制冗余脉冲特征。实验结果表明,FSTA模块在CIFAR-10、ImageNet等数据集上显著提升了SNN
简介:在人工智能领域,Spiking 神经网络(SNNs)因其固有的能效优势而备受关注。然而,由于 SNNs 中的脉冲生成具有稀疏性,对中间输出脉冲的深入分析和优化常常被忽视,这极大地限制了 SNNs 的能效优势和时空特征提取能力。选文介绍了一种基于频率的时空注意力模块(FSTA),通过抑制冗余脉冲特征来增强 SNNs 的特征学习能力。通过深入分析 SNNs 的时空特性,选文提出了一种创新的解决方案,显著提高了 SNNs 的性能和能效。
论文题目:FSTA-SNN: Frequency-Based Spatial-Temporal Attention Module for Spiking Neural Networks (中文:FSTA-SNN:基于频率的Spiking神经网络时空注意力模块)
第一作者:Kairong Yu
通讯作者:Hongwei Wang, , Qi Xu
通讯单位:Zhejiang University-University of Illinois Urbana Champaign Institute, Zhejiang University, Haining, China
发表时间:2025 年
引用参考:The Thirty-Ninth AAAI Conference on Artificial Intelligence (AAAI-25)
论文地址:https://ojs.aaai.org/index.php/AAAI/article/view/34377
目录:
一、SNNs 的时空特性分析
1.1 SNNs 的时空特性
1.2 频率分析方法
二、FSTA 模块的设计与实现
2.1 FSTA 模块概述
2.2 基于 DCT 的空间注意力子模块
2.3 时间注意力子模块
2.4 FSTA 模块集成
三、实验与结果分析
3.1 实验设置
3.2 实验结果
3.3 能效分析
四、结束语
🚀 读完本文,你将获得以下超实用技能和知识储备:
- 深入理解 SNNs 的时空特性:掌握 SNNs 在时空维度上的学习偏好,以及如何通过频率分析优化脉冲特征。
- 掌握 FSTA 模块的设计与实现:学会如何在 SNNs 中集成 FSTA 模块,以提高特征学习能力和降低脉冲发放率。
- 提升模型性能与能效:了解如何通过减少冗余脉冲来提高 SNNs 的性能和能效,同时保持计算效率。
一、SNNs 的时空特性分析
1.1 SNNs 的时空特性
SNNs 通过模拟生物神经元的时空动态来处理信息,其脉冲发放具有稀疏性。选文从时空两个维度对 SNNs 的脉冲输出进行了深入分析,揭示了以下关键特性:
- 空间特性:浅层网络倾向于学习垂直变化特征,而深层网络逐渐学习水平变化特征。
- 时间特性:不同时间步的特征学习差异不大,增加时间步对特征学习的提升有限。
上述特性表明,SNNs 在特征学习中存在冗余,尤其是在浅层网络中。
1.2 频率分析方法
选文使用离散傅里叶变换(DFT)对 SNNs 的脉冲输出进行频率分析。通过频率谱图,选文发现 SNNs 的频率分布具有以下特点:
- 频率分布一致性:不同架构和数据集下的 SNNs 频率分布高度一致。
- 时间步稳定性:同一层在不同时间步的频率分布基本相同,表明增加时间步对特征学习的提升有限。
二、FSTA 模块的设计与实现
2.1 FSTA 模块概述
基于上述分析,选文提出了一种基于频率的时空注意力模块(FSTA)。该模块通过抑制冗余脉冲特征,增强 SNNs 的特征学习能力。FSTA 模块包含两个子模块:基于 DCT 的空间注意力子模块和时间注意力子模块。
2.2 基于 DCT 的空间注意力子模块
该子模块通过 DCT 提取输入特征图的全频谱信息,生成空间注意力权重矩阵,从而增强特征表示。具体实现如下:
- 频率特征提取:通过 DCT 提取输入特征图的全频谱信息。
- 空间注意力权重生成:使用线性层和 Sigmoid 函数生成空间注意力权重矩阵。
- 特征增强:将空间注意力权重矩阵与输入特征图相乘,增强特征表示。
2.3 时间注意力子模块
该子模块通过时间通道特征聚合,生成时间注意力权重,从而调节不同时间步的特征。具体实现如下:
- 时间特征聚合:通过平均池化和最大池化提取时间通道特征。
- 时间注意力权重生成:使用线性层和 Sigmoid 函数生成时间注意力权重。
- 特征增强:将时间注意力权重与输入特征图相乘,增强特征表示。
2.4 FSTA 模块集成
FSTA 模块通过串行组合时间注意力子模块和空间注意力子模块,实现时空特征的协同增强。具体实现如下:
- 时间特征增强:首先应用时间注意力子模块,增强时间动态。
- 空间特征增强:然后应用空间注意力子模块,增强空间特征。
- 特征融合:通过缩放因子融合时间特征和空间特征,生成最终输出。
三、实验与结果分析
3.1 实验设置
选文在多个静态数据集(CIFAR-10、CIFAR-100、ImageNet)和动态数据集(CIFAR10-DVS)上进行了实验,使用 ResNet 和 VGG 等常见架构进行评估。
3.2 实验结果
实验结果表明,FSTA 模块显著提高了 SNNs 的性能,同时降低了脉冲发放率。具体结果如下:
- CIFAR-10:使用 ResNet20,FSTA 模块将准确率提升至 94.72%,比基线模型提高了 0.44%。
- CIFAR-100:使用 ResNet19,FSTA 模块将准确率提升至 80.42%,比基线模型提高了 0.05%。
- ImageNet:使用 ResNet18,FSTA 模块将准确率提升至 68.21%,比基线模型提高了 0.21%。
- CIFAR10-DVS:使用 ResNet20,FSTA 模块将准确率提升至 81.50%,比基线模型提高了 1.50%。
3.3 能效分析
FSTA 模块通过减少冗余脉冲,显著降低了 SNNs 的脉冲发放率,从而提高了能效。实验结果表明,FSTA 模块将脉冲发放率降低了 33.99%,同时保持了计算效率。
四、结束语
选文通过频率分析揭示了 SNNs 的时空特性,并提出了一种基于频率的时空注意力模块(FSTA)。FSTA 模块通过抑制冗余脉冲特征,显著提高了 SNNs 的性能和能效。实验结果表明,FSTA 模块在多个数据集上均取得了显著的性能提升,同时降低了脉冲发放率。
希望本文的内容能够帮助你更好地理解和应用 FSTA 模块,提升你的 SNNs 研究和开发能力。
最后,感谢你的阅读!如果你觉得本文对你有帮助,不妨点赞和关注,我会继续分享更多关于工业大数据与人工智能工业应用领域的佳文鉴赏系列。🚀
关注专栏,每周更新,带你持续了解更多前沿性科研报道。
版权归文章作者所有,本文为对原文的翻译性总结介绍与解读,或有不当之处,敬请指正!
– 欢迎扫码关注:华北理工大学低碳与智能冶金实验室
更多推荐
所有评论(0)