在这里插入图片描述
简介:在人工智能领域,Spiking 神经网络(SNNs)因其固有的能效优势而备受关注。然而,由于 SNNs 中的脉冲生成具有稀疏性,对中间输出脉冲的深入分析和优化常常被忽视,这极大地限制了 SNNs 的能效优势和时空特征提取能力。选文介绍了一种基于频率的时空注意力模块(FSTA),通过抑制冗余脉冲特征增强 SNNs 的特征学习能力。通过深入分析 SNNs 的时空特性,选文提出了一种创新的解决方案,显著提高了 SNNs 的性能和能效。

论文题目:FSTA-SNN: Frequency-Based Spatial-Temporal Attention Module for Spiking Neural Networks (中文:FSTA-SNN:基于频率的Spiking神经网络时空注意力模块)
第一作者:Kairong Yu
通讯作者:Hongwei Wang, , Qi Xu
通讯单位:Zhejiang University-University of Illinois Urbana Champaign Institute, Zhejiang University, Haining, China
发表时间:2025 年
引用参考:The Thirty-Ninth AAAI Conference on Artificial Intelligence (AAAI-25)
论文地址https://ojs.aaai.org/index.php/AAAI/article/view/34377

目录

一、SNNs 的时空特性分析
1.1 SNNs 的时空特性
1.2 频率分析方法
二、FSTA 模块的设计与实现
2.1 FSTA 模块概述
2.2 基于 DCT 的空间注意力子模块
2.3 时间注意力子模块
2.4 FSTA 模块集成
三、实验与结果分析
3.1 实验设置
3.2 实验结果
3.3 能效分析
四、结束语


🚀 读完本文,你将获得以下超实用技能和知识储备:

  • 深入理解 SNNs 的时空特性:掌握 SNNs 在时空维度上的学习偏好,以及如何通过频率分析优化脉冲特征。
  • 掌握 FSTA 模块的设计与实现:学会如何在 SNNs 中集成 FSTA 模块,以提高特征学习能力和降低脉冲发放率。
  • 提升模型性能与能效:了解如何通过减少冗余脉冲来提高 SNNs 的性能和能效,同时保持计算效率。

一、SNNs 的时空特性分析

1.1 SNNs 的时空特性

SNNs 通过模拟生物神经元的时空动态来处理信息,其脉冲发放具有稀疏性。选文从时空两个维度对 SNNs 的脉冲输出进行了深入分析,揭示了以下关键特性:

  • 空间特性:浅层网络倾向于学习垂直变化特征,而深层网络逐渐学习水平变化特征。
  • 时间特性:不同时间步的特征学习差异不大,增加时间步对特征学习的提升有限。

上述特性表明,SNNs 在特征学习中存在冗余,尤其是在浅层网络中。

在这里插入图片描述

1.2 频率分析方法

选文使用离散傅里叶变换(DFT)对 SNNs 的脉冲输出进行频率分析。通过频率谱图,选文发现 SNNs 的频率分布具有以下特点:

  • 频率分布一致性:不同架构和数据集下的 SNNs 频率分布高度一致。
  • 时间步稳定性:同一层在不同时间步的频率分布基本相同,表明增加时间步对特征学习的提升有限。
    在这里插入图片描述

二、FSTA 模块的设计与实现

2.1 FSTA 模块概述

基于上述分析,选文提出了一种基于频率的时空注意力模块(FSTA)。该模块通过抑制冗余脉冲特征,增强 SNNs 的特征学习能力。FSTA 模块包含两个子模块:基于 DCT 的空间注意力子模块时间注意力子模块
在这里插入图片描述

2.2 基于 DCT 的空间注意力子模块

该子模块通过 DCT 提取输入特征图的全频谱信息,生成空间注意力权重矩阵,从而增强特征表示。具体实现如下:

  1. 频率特征提取:通过 DCT 提取输入特征图的全频谱信息。
  2. 空间注意力权重生成:使用线性层和 Sigmoid 函数生成空间注意力权重矩阵。
  3. 特征增强:将空间注意力权重矩阵与输入特征图相乘,增强特征表示。

在这里插入图片描述

2.3 时间注意力子模块

该子模块通过时间通道特征聚合,生成时间注意力权重,从而调节不同时间步的特征。具体实现如下:

  1. 时间特征聚合:通过平均池化和最大池化提取时间通道特征。
  2. 时间注意力权重生成:使用线性层和 Sigmoid 函数生成时间注意力权重。
  3. 特征增强:将时间注意力权重与输入特征图相乘,增强特征表示。
    在这里插入图片描述

2.4 FSTA 模块集成

FSTA 模块通过串行组合时间注意力子模块和空间注意力子模块,实现时空特征的协同增强。具体实现如下:

  1. 时间特征增强:首先应用时间注意力子模块,增强时间动态。
  2. 空间特征增强:然后应用空间注意力子模块,增强空间特征。
  3. 特征融合:通过缩放因子融合时间特征和空间特征,生成最终输出。
    在这里插入图片描述

三、实验与结果分析

3.1 实验设置

选文在多个静态数据集(CIFAR-10、CIFAR-100、ImageNet)和动态数据集(CIFAR10-DVS)上进行了实验,使用 ResNet 和 VGG 等常见架构进行评估。
在这里插入图片描述

3.2 实验结果

实验结果表明,FSTA 模块显著提高了 SNNs 的性能,同时降低了脉冲发放率。具体结果如下:

  • CIFAR-10:使用 ResNet20,FSTA 模块将准确率提升至 94.72%,比基线模型提高了 0.44%。
  • CIFAR-100:使用 ResNet19,FSTA 模块将准确率提升至 80.42%,比基线模型提高了 0.05%。
  • ImageNet:使用 ResNet18,FSTA 模块将准确率提升至 68.21%,比基线模型提高了 0.21%。
  • CIFAR10-DVS:使用 ResNet20,FSTA 模块将准确率提升至 81.50%,比基线模型提高了 1.50%。
    在这里插入图片描述

3.3 能效分析

FSTA 模块通过减少冗余脉冲,显著降低了 SNNs 的脉冲发放率,从而提高了能效。实验结果表明,FSTA 模块将脉冲发放率降低了 33.99%,同时保持了计算效率。
在这里插入图片描述

四、结束语

选文通过频率分析揭示了 SNNs 的时空特性,并提出了一种基于频率的时空注意力模块(FSTA)。FSTA 模块通过抑制冗余脉冲特征,显著提高了 SNNs 的性能和能效。实验结果表明,FSTA 模块在多个数据集上均取得了显著的性能提升,同时降低了脉冲发放率

希望本文的内容能够帮助你更好地理解和应用 FSTA 模块,提升你的 SNNs 研究和开发能力。


最后,感谢你的阅读!如果你觉得本文对你有帮助,不妨点赞和关注,我会继续分享更多关于工业大数据人工智能工业应用领域的佳文鉴赏系列。🚀

关注专栏每周更新,带你持续了解更多前沿性科研报道

版权归文章作者所有,本文为对原文的翻译性总结介绍与解读,或有不当之处,敬请指正!

欢迎扫码关注:华北理工大学低碳与智能冶金实验室
在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐