[PR 2026]Prompt-guided dual-channel attention model predicts brain activation from functional and st
计算机-人工智能-双模态局部-全局特征及特征工程的脑任务预测

论文代码:https://github.com/hw654833612/Brain-cognitive-encoding
目录
2.3.1. Predicting brain activation patterns
2.4.1. Construction of multimodal brain feature sets
2.4.2. Dual-channel attention network
2.4.4. Categorized-contrastive learning
2.5.1. Dataset and pre-processing
2.5.2. Experimental settings and evaluation metrics
2.5.3. Comparison with other models
2.5.4. Individual identification accuracy of brain activation patterns
2.6.1. Analysis of local and global information
2.6.2. Analysis of factors affecting individual identification accuracy
2.6.4. Limitations and future work
1. 心得
(1)啊,新奇的组装
2. 论文逐段精读
2.1. Abstract
①静息态功能和结构脑影像都可以作为理解任务态脑激活的基础
②几乎没有论文将静息态的整合进任务态预测
2.2. Introduction
①虽然任务fmri(tfMRI)对于疾病诊断来说也很重要,但是获取数据非常难,所以需要一个替代
②sMRI可以预测任任务态大脑激活
③作者提出了提示引导双通道注意力模型(Prompt-Guided Dual Channel Attention Model, PG-DCAM),来结合fMRI和sMRI
2.3. Related work
2.3.1. Predicting brain activation patterns
①sMRI能捕获个体差异并预测认知任务中的大脑激活
②多模态融合持续发展
2.3.2. Prompt technique
①提示大模型可以让大模型获得更好的思维链
2.3.3. Contrastive learning
①对比学习可以增强性能
2.4. Method
①PG-DCAM框架图及关键组件:(A) 特征提取模块;(b)双信道注意力网络;(c) 提示引导模块:

2.4.1. Construction of multimodal brain feature sets
①对于rs-fMRI,对时间序列使用皮尔逊相关从而得到功能特征,对sMRI提取皮层结构特征(大脑皮层内外表面每个顶点的空间位置(x、y和z坐标)、皮层厚度、沟深、曲率、髓鞘校正的T1w/T2w比率,以及Desikan和Destrieux图谱的神经解剖标记)
。
②将rs-fMRI和sMRI拼接得到最终样本脑特征:
其中是皮层顶点,
是功能特征维度,
是结构特征维度
2.4.2. Dual-channel attention network
(1)The local attention channel
①使用图注意力网络对节点提取局部信息
②对于每个大脑,构图,节点
是皮质个数,边
③计算节点注意力得分:
其中是可学习矩阵,
是激活函数,
是顶点
的邻居顶点
④根据邻居节点注意力得分更新顶点:
总共设计了三层图注意力网络
(2)The global attention channel
①使用“A multi-modal parcellation of human cerebral cortex”这篇论文提出的脑分割办法将大脑分割成360份。
②定义一组可学习的区域特征:,其中
是脑区个数
③将原始皮质特征分为
组,注意力机制定义为:
其中的上标区分了Q、K、V,在这每个脑区最后只有一个特征输出,然后要被复制到这个脑区所有的皮质上
③经历了复制和残差的被变成
,然后和局部注意力后的拼接起来变成最终脑特征:
2.4.3. Prompt guided module
①提示引导模块设计:

(1)Prompt encoding block
①CLIP编码器ViT-L/32对多种认知任务如“工作记忆:2背体”、“关系处理:匹配”和“情感处理:形状”的文本进行特征提取,其中提示向量被定义为:
其中是说明文本,
是编码后的说明特征,
是认知任务个数
(2)Prompt interaction block
①原始特征先通过MLP,GAP和MLP压缩,然后再和提示词合并做注意力:
②注意力和原始相乘后的结果,再和压缩后的
相加得到最终结果:
2.4.4. Categorized-contrastive learning
①损失框架:

②总损失:
(1)Categorized loss
①交叉熵损失:
(2)Contrastive loss
①正损失:
其中是真实激活,
是预测激活,
是样本的梯度削波阈值
②负损失:
这个的也是阈值
③为了同任务下样本保持个体差异,设计样本级损失:
其中分母是同批次下所有可能的两两样本组合,相似度至少要小于
(3)Reconstructive loss
①脑激活重构损失:
2.5. Experiments
2.5.1. Dataset and pre-processing
①公开数据集:Human Connectome Project (HCP) Young Adult dataset
②样本数:1206(任务剔除后只有958名)
③剔除缺乏皮层灰质的内侧壁,左侧脑半球有29,696个顶点,右侧脑半球有29,716个顶点
④七个任务领域(包含86种任务,但作者排除了仅涉及皮层下区域的反向任务对比和GAM对比(惩罚-奖励),只剩46个):工作记忆(WM)、赌博(GAM)、运动(MOT)、语言(LANG)、社会认知(SOC)、关系处理(RELA)和情感(EMO)
2.5.2. Experimental settings and evaluation metrics
①服务器:Nvidia Tesla A100 40 GB
②优化器:AdamW,学习率为1e-3,权重衰减为1e-4
③批次:2
④Epoch:200
2.5.3. Comparison with other models
①对比表:

②预测的脑激活重叠和Dice系数度量的多个阈值下表现:

2.5.4. Individual identification accuracy of brain activation patterns
①所有39名测试中领域级别准确率:

2.5.5. Ablation analysis
(1)Analysis of input modality (functional and structural brain imaging)
①两种模态的消融:

(2)Analysis of the prompt-guided module
①提示词消融:

(3)Analysis of the categorized-contrastive loss
①对比损失消融:

②任务间差异指数(ITDI):

2.6. Discussion
2.6.1. Analysis of local and global information
①局部和全局通道消融:

2.6.2. Analysis of factors affecting individual identification accuracy
①组合消融

2.6.3. Analysis of predictability of brain regions
①高值的区域可能在不同任务中持续激活:

2.6.4. Limitations and future work
①还可以加DTI或DWI
②可以用非主观的疾病特征来替代提示词
③视觉文本特征平衡性还需探讨
④数据集有限
⑤计算复杂性
2.7. Conclusion
~
更多推荐



所有评论(0)