论文144：Deep learning-based brain age prediction in normal aging and dementia (Nature Aging‘22)

用3D-DenseNet分别基于FDG-PET和结构MRI训练脑龄预测模型，系统对比两种模态在正常衰老和多种痴呆类型（MCI、AD、FTD、DLB）中的表现差异，并通过遮挡分析揭示年龄和模态特异的脑区贡献，测试BAG对认知障碍进展的前瞻预测能力。

因吉

11人浏览 · 2026-05-10 16:35:18

因吉 · 2026-05-10 16:35:18 发布

文章目录

1 要点
Nature Aging 2022 |
2 引言
3 方法

1 要点

Nature Aging 2022 |

标题：Deep learning-based brain age prediction in normal aging and dementia
中文： 基于深度学习的脑龄预测在正常衰老和痴呆中的应用
作者： Jeyeon Lee, Brian J. Burkett, Hoon-Ki Min, Matthew L. Senjem, Emily S. Lundt, Hugo Botha, Jonathan Graff-Radford, Leland R. Barnard, Jeffrey L. Gunter, Christopher G. Schwarz, Kejal Kantarci, David S. Knopman, Bradley F. Boeve, Val J. Lowe, Ronald C. Petersen, Clifford R. Jack Jr., David T. Jones
机构： Mayo Clinic（放射科、信息技术科、健康科学研究科、神经科）
期刊： Nature Aging, Vol. 2, No. 5, pp. 412–424 (2022)
代码：https://github.com/Neurology-AI-Program/Brain_age_prediction.git

研究背景：
脑龄是从单次脑影像估计的生物学年龄。脑龄差（BAG = 估计脑龄 − 实际年龄）已被证实与死亡风险、神经退行性疾病和多种临床状况相关。此前脑龄研究几乎全部基于结构MRI（Magnetic Resonance Imaging，磁共振成像），极少利用 FDG-PET（Fluorodeoxyglucose Positron Emission Tomography，氟脱氧葡萄糖正电子发射断层扫描）这类功能性影像。且多数方法缺乏对模型所用脑区的解释，BAG在临床前阶段的前瞻预测价值也尚未被探索。

研究目标：用3D-DenseNet分别基于FDG-PET和结构MRI训练脑龄预测模型，系统对比两种模态在正常衰老和多种痴呆类型（MCI、AD、FTD、DLB）中的表现差异，并通过遮挡分析揭示年龄和模态特异的脑区贡献，测试BAG对认知障碍进展的前瞻预测能力。

关键技术：

3D-DenseNet：4个dense block（3/6/12/8 层），增长率 $k = 48$ ，输入尺寸121×145×121，输出单个标量（年龄）。与3D-ResNet和 SFCN对比。
遮挡敏感性分析：11×11×11立方体滑动遮挡，计算 $ΔMAE = MAE_{occlusion} − MAE_{original}$ ，生成年龄分层（30–100 岁，每10 岁一组）的显著性图。
线性偏差校正：BAG与实际年龄（CA）存在负相关（回归稀释效应），用 $y_{corrected} = (y − b)/a − x$ 校正。
体素级线性回归：以BAG为回归子、CA为协变量，检出各疾病组中与BAG升高相关的脑区，与正常衰老 $β$ 图做空间相关。

数据集：Mayo Clinic（MCSA + ADRC），共2,349 人、4,127次扫描（CU1,805 人；MCI 480；AD 215；FTD 45；DLB 86），年龄 26–98 岁。外部验证：ADNI（CU 330 人；MCI 647；AD 255）。训练仅用CU的首次扫描（ $n = 1, 805$ ），并采用5折交叉验证。

2 引言

2.1 脑衰老的结构与功能变化

衰老生物学极其复杂，至今未被完全理解。脑衰老同时涉及结构和功能两个维度的变化。结构MRI研究表明，年龄增长伴随灰质体积缩减（最显著在额叶、岛叶皮层和海马）、脑室系统和颅内脑脊液体积增大、以及白质微结构改变。功能影像（PET）则显示，脑衰老与全脑氧利用率、脑血流和葡萄糖摄取的下降相关。年龄相关的糖代谢降低在额叶、后扣带回、后顶叶及内侧颞叶（痴呆的核心病理区域）最为突出。而初级运动皮层、枕叶、小脑和皮层下结构（丘脑、壳核、苍白球）相对不受代谢衰老的影响。

基于这些发现，用脑影像预测年龄已成为神经科学的重要方向。估计年龄被称为脑龄，可区分于个体的实际年龄（Chronological Age, CA）。近年来，随着数据规模的扩大和深度学习技术的进步，CNN在认知正常（Cognitively Unimpaired, CU）人群中实现了越来越精确的脑龄估计。脑龄差（BAG = 脑龄 − CA）作为一种有前景的个性化脑健康生物标志物，其值偏高（即脑龄高于实际年龄）与死亡率升高、神经退行性疾病及多种临床不良结局相关。

2.2 现有研究的缺口

此前脑龄研究存在四个主要缺口：

几乎所有研究仅基于结构MRI，仅有的一项FDG-PET研究使用非深度学习方法且样本量很小（n=205）
仅有少数MRI研究报告了CNN的解释图，模型究竟依赖哪些脑区做年龄推断仍未被充分阐明
BAG在临床前阶段的纵向预测能力尚未被探索，也就是说，基线BAG能否在症状出现之前就预示未来的认知衰退？
不同痴呆类型的BAG升高分别由哪些脑区驱动、这些脑区模式与正常衰老有多相似，缺乏系统比较。

2.3 本文贡献

分别用FDG-PET和结构MRI训练3D-DenseNet，系统对比两种模态在脑龄预测中的表现差异
通过遮挡敏感性分析揭示年龄分层、模态特异的显著性脑区
在四种痴呆类型（MCI、AD、FTD、DLB）中全面测试BAG与认知分数和AD生物标志物（Amyloid PET、Tau PET）的关联
首次在纵向设计中证明基线BAG可前瞻预测CU→MCI/AD 和MCI→AD 的临床转化
用体素级线性回归揭示各疾病组BAG的脑区驱动模式，并量化其与正常衰老的空间相似性

3 方法

3.1 数据集

Mayo Clinic 主数据集：来自 Mayo Clinic Study of Aging（MCSA，基于人群的认知衰老研究）和 Alzheimer’s Disease Research Center（ADRC，临床队列），共 2,349 人、4,127 次扫描。临床诊断经共识小组判定，分为5组：

CU：1,805人，2,879次扫描
MCI（Mild Cognitive Impairment，轻度认知障碍）：480人，666次扫描
AD（Alzheimer’s Disease，阿尔茨海默病）：215 人，372 次扫描
FTD（Frontotemporal Dementia，额颞叶痴呆）：45 人，69 次扫描
DLB（Dementia with Lewy Bodies，路易体痴呆）：86 人，141 次扫描

此外，部分被试进行了PiB PET（Pittsburgh Compound B，amyloid-β示踪剂， $n = 2, 508$ ）和flortaucipir PET（tau示踪剂， $n = 608$ ）。认知评估包括CDR-SB、STMS和MMSE。

ADNI 外部验证集（Alzheimer’s Disease Neuroimaging Initiative）：CU 330人（454次扫描）、MCI 647人（885次扫描）、AD 255人（283 次扫描）。

3.2 影像预处理

MRI：T1加权像经SPM12统一分割配准到MCALT空间，强度非均匀性校正后以个体化白质掩膜均值归一化。

FDG PET：注射后30–40分钟采集，与同时间点MRI共配准后 warping 到 MCALT 空间。SUVR（标准化摄取值比）以脑桥中位摄取值为参考计算。

Amyloid PET (PiB)：40–60分钟采集，SUVR以小脑脚灰质为参考。Meta-ROI取前额叶、眶额叶、顶叶、颞叶、前扣带回和后扣带回/楔前叶的均值。

Tau PET (flortaucipir)：80–100分钟采集，Meta-ROI取杏仁核、内嗅皮层、梭状回、海马旁回、颞下回和颞中回的均值。

3.3 3D-DenseNet 架构与训练

输入：121×145×121 体素的标准化脑影像（FDG SUVR或MRI归一化强度）。输出：单个标量CA（年）。

网络结构：初始5×5×5卷积层 → 4个Dense Block（层数3/6/12/8）→ 其间各夹1个Transition Block。每层Dense Block：1×1×1瓶颈卷积 → 3×3×3卷积，层间密集前馈连接。增长率 $k = 48$ 。最终经过全局平均池化后全连接1,457单元 → 输出层。总参数量约7,000万。

训练配置：仅使用CU被试的首次扫描（ $n = 1, 805$ ）以避免同一被试多时间点数据泄漏。5折交叉验证（60/20/20）。损失函数：MAE（平均绝对误差，单位年）。优化器：Adam（β₁=0.9, β₂=0.99），He初始化，初始学习率 1×10⁻⁴，每10epoch减半，7epoch无改善则更新。Epoch 150，batch size 4，GPU：Tesla P100。实现：Keras + TensorFlow。

对比架构：3D-ResNet101 和 SFCN；DenseNet与ResNet 性能相当（均优于SFCN），但DenseNet参数效率更高。

3.4 数据划分策略实验

为检验同一被试的多时间点扫描是否导致过拟合，比较了5种划分方案：仅用首次扫描（Option 1，主实验方案）、允许被试跨训练/验证/测试重叠（Option 2–3）、训练用多时间点但测试仅用首次（Option 4–5）。结果确认：被试跨集重叠会显著高估模型精度（p<0.001），因此 Option 1为最严格且无偏的方案。

3.5 线性偏差校正

BAG与CA存在系统性负相关（回归稀释效应：模型对年轻人高估、对老年人低估）。使用Smith et al. 方法：在测试集上拟合 $y = a \cdot x + b$ ，校正后 $B A G = (y - b) / a - x$ 。校正系数仅从CU组估计，然后统一应用于所有疾病组，确保校正的公平性。

3.6 遮挡敏感性分析

为生成模型的可解释性图，将测试集被试按CA分为7个年龄组（30–100 岁，10 岁间隔）。在每个年龄组内，用11×11×11体素的立方掩膜以 11步长滑动遮挡（约1,331个遮挡位置），对每个遮挡后的图像重新做年龄推断，计算 $ΔMAE = MAE_{occlusion} − MAE_{original}。$ ΔMAE $越大，该位置对年龄预测越关键。将 1 1^{3} 的$ ΔMAE矩阵经三次插值重建到121³原空间，5 折平均后除以最大值归一化至[0,1]。

3.7 体素级线性回归

以BAG为回归子、CA 为干扰协变量，在全脑每个体素上做线性回归，检出各疾病组中与BAG升高显著相关的脑区（FDR校正，q<0.01，最小团块30体素）。对CU组，以 CA（而非 BAG）为回归子做相同分析，得到正常衰老的β图。然后计算各疾病组BAG β图与正常衰老 β图的 Pearson空间相关性，量化两者的模式相似性。