AI-Based CSI Feedback With Digital Twins: Real-World Validation and Insights
—深度学习(DL)在增强多输入多输出(MIMO)通信系统的信道状态信息(CSI)反馈方面展现出了巨大潜力,这也是 3GPP 标准组织目前正在研究的课题。数字孪生(Digital twins,DTs)已成为生成用于训练基于 DL 的 CSI 反馈模型的特定站点数据集的有效手段。然而,现有的大多数研究仅依赖于仿真,数字孪生在降低 DL 训练成本方面的有效性尚未通过现实的实验设置得到验证。
Abstract——深度学习(DL)在增强多输入多输出(MIMO)通信系统的信道状态信息(CSI)反馈方面展现出了巨大潜力,这也是 3GPP 标准组织目前正在研究的课题。数字孪生(Digital twins,DTs)已成为生成用于训练基于 DL 的 CSI 反馈模型的特定站点数据集的有效手段。
然而,现有的大多数研究仅依赖于仿真,数字孪生在降低 DL 训练成本方面的有效性尚未通过现实的实验设置得到验证。本文通过利用复制的 3D 模型和精确的天线属性进行射线追踪,建立了一个真实世界(real-world,RW)环境和相应的虚拟信道,从而填补了这一空白。
我们评估了在 DT 环境中训练的模型是否能在 RW 场景中有效运行,并量化了在线学习(online learning,OL)对性能提升的益处。结果表明,即使采用了 OL,专用的 DT 对于在 RW 场景中实现令人满意的性能仍然至关重要。
Index Terms——大规模 MIMO,信道状态信息,隐式反馈,深度学习,数字孪生,在线学习。
文章目录
I. INTRODUCTION
通过在基站(BSs)部署大量发射天线的大规模多输入多输出(MIMO)系统来提高频谱效率,是 5G 和新兴 6G 通信系统的关键策略 [1]。要充分利用大规模 MIMO 的优势,需要在 BS 端获得准确的信道状态信息(CSI),因为 CSI 的质量直接影响系统性能 [2]。在频分双工(FDD)系统中,下行链路 CSI 是在用户设备(UE)端估计并反馈给 BS 的。当前的 5G 新空口(NR)系统,例如采用 Type II 反馈的系统 [3],依赖于基于码本的方法。然而,随着天线数量的增加,码本设计变得效率低下,导致 CSI 质量下降或反馈开销过大。
近期的深度学习(DL)进展已证明了其在 CSI 反馈方面的巨大潜力 [4]。基于 DL 的自动编码器已被应用于压缩和重构完整的下行链路 CSI,而后续工作 [5] 引入了隐式反馈机制,侧重于反馈预编码矩阵而非完整的 CSI。该方法提供了比传统码本方案更高的精度,且兼容 5G NR 标准。最近的努力通过结合量化感知训练 [6] 和熵编码技术 [7],进一步提高了反馈效率。
然而,训练 DL 模型需要庞大的数据集,而在真实世界(RW)系统中获取这些数据且不导致性能下降是具有挑战性的。数字孪生(Digital twins,DTs)已成为生成用于 DL 模型训练的特定站点数据集的高效解决方案 [8], [9], [10], [11]。此外,近期的进展 [12] 表明,利用公共数据和开源工具构建低成本 DT 是可行的,这进一步支持了基于 DT 训练的实用性。尽管如此,DT 仿真与 RW 环境之间的差异往往会导致在 DT 数据上训练的模型在实际部署时性能下降。集成利用极少量 RW 数据的在线学习(online learning,OL)技术对于提升模型性能至关重要 [10]。迄今为止(To date),大多数研究仍依赖于仿真,需要一个现实的实验设置来验证 DT 在降低 DL 训练成本方面的有效性。
本文通过利用复制的 3D 模型(replicated 3D models)和精确的天线属性进行射线追踪(ray tracing),建立了一个 RW 环境和相应的虚拟信道(corresponding virtual channels),从而解决了这一差距。
我们构建了一个包含 RW 测量值和源自这些测量值的虚拟信道数据的综合数据集。该数据集用于训练一个基于 DL 的自动编码器,用于隐式 CSI 反馈(implicit CSI feedback)。为了弥合虚拟信道与真实信道之间(bridge the gap between)的差距,我们采用了 OL 技术,利用极少量的 RW 数据对 DL 模型进行微调。通过详细的实验,我们比较了不同反馈方案的通信性能,并解决了以下问题:
- 在 DT 环境中训练的模型能否在 RW 场景中有效运行?
- OL 如何提升性能?
II. SYSTEM MODEL AND DESIGN WITH DT
A. 通信系统模型
我们考虑一个单用户 MIMO 系统,其中基站(BS)拥有 N t N_t Nt 根发射天线,用户设备(UE)拥有 N r N_r Nr 根接收天线。该系统采用具有 N c N_c Nc 个子载波的正交频分复用(OFDM)波形。在 5G 新空口(NR)系统中,UE 获取下行链路 CSI,计算 N s N_s Ns 个特征向量(或空间预编码器),并通过上行链路反馈给 BS。第 s s s 个特征向量 w s ∈ C N t \mathbf{w}_s \in \mathbb{C}^{N_t} ws∈CNt(归一化使得 ∥ w s ∥ 2 = 1 \|\mathbf{w}_s\|_2 = 1 ∥ws∥2=1)通过特征值分解获得:
( 1 N c ∑ n = 1 N c H n H H n ) w s = λ s w s , (1) \left( \frac{1}{N_c} \sum_{n=1}^{N_c} \mathbf{H}_n^H \mathbf{H}_n \right) \mathbf{w}_s = \lambda_s \mathbf{w}_s, \tag{1} (Nc1n=1∑NcHnHHn)ws=λsws,(1)
其中 H n ∈ C N r × N t \mathbf{H}_n \in \mathbb{C}^{N_r \times N_t} Hn∈CNr×Nt 表示第 n n n 个子载波( n ∈ 1 , … , N c n \in 1, \dots, N_c n∈1,…,Nc)的信道矩阵,而 λ s \lambda_s λs 是对应的第 s s s 大特征值。预编码矩阵构造为
W = [ w 1 , w 2 , … , w N s ] ∈ C N t × N s . (2) \mathbf{W} = [\mathbf{w}_1, \mathbf{w}_2, \dots, \mathbf{w}_{N_s}] \in \mathbb{C}^{N_t \times N_s}. \tag{2} W=[w1,w2,…,wNs]∈CNt×Ns.(2)
5G NR 系统使用基于码本的方法来反馈预编码矩阵。具体而言,3GPP Release-15 [3] 中的 Type II 码本采用基于 Type I 码本的双码本(Dual-Codebook)技术。该码本支持最多两个空间流,并通过组合最多四个过采样的正交离散傅里叶变换(DFT)波束来重构预编码矩阵。尽管其性能接近完美反馈,但巨大的开销降低了系统效率。为了应对这一挑战,我们考虑一种基于 DT 的方法来近似 RW 场景。
B. DT Framework
真实世界(RW)信道(记为 H \mathcal{H} H)受三个主要组成部分的影响:(i) 环境条件 E \mathcal{E} E,包括物理障碍物、大气变化、反射和干扰。(ii) 天线效应 A \mathcal{A} A,由增益、辐射方向图和极化等设计因素决定。(iii) 传播现象 g ( ⋅ ) g(\cdot) g(⋅),支配着反射、衍射和散射等信号行为。因此,RW 信道表示为:
H = g ( E , A ) . (3) \mathcal{H} = g(\mathcal{E}, \mathcal{A}). \tag{3} H=g(E,A).(3)
准确建模 E \mathcal{E} E、 A \mathcal{A} A 和 g ( ⋅ ) g(\cdot) g(⋅) 具有挑战性。因此,我们利用通过高级仿真生成的虚拟信道 H ~ \widetilde{\mathcal{H}} H 来近似 H \mathcal{H} H:
- 3D 模型 E ~ \widetilde{\mathcal{E}} E :详细的 3D 模型捕捉关键组件(BS、UE、反射体和散射体)的位置、方向、形状和材料,其中电导率和介电常数等材料属性会影响信号传播。
- 天线属性 A ~ \widetilde{\mathcal{A}} A :对天线效应(包括增益、相位、类型、放置和极化)进行建模,以准确模拟发射机和接收机的行为。
- 射线追踪 g ~ ( ⋅ ) \tilde{g}(\cdot) g~(⋅):这种确定性方法利用 3D 几何和材料数据来模拟传播路径,计入透射、反射、散射和衍射,并提供路径增益、时延和角度参数。
通过整合射线追踪仿真中的所有参数,第 n n n 个子载波处的虚拟信道建模为:
H ~ n = ∑ l = 1 L h G ( θ l AoD , θ l AoA ) e − j 2 π n N c τ l , (4) \widetilde{\mathbf{H}}_n = \sum_{l=1}^{L_h} \mathbf{G}(\theta_l^{\text{AoD}}, \theta_l^{\text{AoA}}) e^{-j 2\pi \frac{n}{N_c} \tau_l}, \tag{4} H n=l=1∑LhG(θlAoD,θlAoA)e−j2πNcnτl,(4)
其中 L h L_h Lh 是传播路径的总数; θ l AoD \theta_l^{\text{AoD}} θlAoD 和 θ l AoA \theta_l^{\text{AoA}} θlAoA 分别是第 l l l 条路径的离开角(AoD)和到达角(AoA),均包含方位角和仰角分量。函数 G ( ⋅ ) ∈ C N r × N t \mathbf{G}(\cdot) \in \mathbb{C}^{N_r \times N_t} G(⋅)∈CNr×Nt 是由 AoD 和 AoA 决定的复增益矩阵。项 τ l \tau_l τl 是与第 l l l 条路径相关的传播时延。
构建准确的虚拟信道 H ~ \widetilde{\mathcal{H}} H 使得能够近似虚拟预编码矩阵 W ~ \widetilde{\mathbf{W}} W ,使其与 RW 对应项紧密匹配。然而,由于反射、衍射、天线方向图和环境噪声方面的建模限制,DT 无法完全复制 RW 信道。为了解决这个问题,我们提出了一种将 DL 与 DT 数据相结合的混合方法。如图 1 所示,模型最初在合成 DT 数据上进行训练,随后使用有限的 RW 数据进行微调,从而提高准确性和鲁棒性。

C. CSI Feedback With DTs
为了实现隐式反馈,我们采用基于 DL 的自动编码器 EVCsiNet [5],其设计旨在降低计算复杂度和延迟。如图 1 所示,编码和解码神经网络分别部署在 UE 和 BS 处。通过分离实部和虚部对复数值输入预编码矩阵进行预处理。由 Θ E \Theta_{\text{E}} ΘE 和 Θ D \Theta_{\text{D}} ΘD 参数化的编码器和解码器分别表示为 f e ( ⋅ ; Θ E ) f_e(\cdot; \Theta_{\text{E}}) fe(⋅;ΘE) 和 f d ( ⋅ ; Θ D ) f_d(\cdot; \Theta_{\text{D}}) fd(⋅;ΘD)。整体自动编码器 f a ( ⋅ ; Θ ) f_a(\cdot; \Theta) fa(⋅;Θ)(其中 Θ = ( Θ E , Θ D ) \Theta = (\Theta_{\text{E}}, \Theta_{\text{D}}) Θ=(ΘE,ΘD))表示为:
f a ( W ; Θ ) = f d ( Q ( f e ( W ; Θ E ) ) ; Θ D ) , (5) f_a(\mathbf{W}; \Theta) = f_d(Q(f_e(\mathbf{W}; \Theta_E)); \Theta_D), \tag{5} fa(W;Θ)=fd(Q(fe(W;ΘE));ΘD),(5)
其中 Q ( ⋅ ) Q(\cdot) Q(⋅) 表示量化器。编码器将虚拟预编码矩阵 W \mathbf{W} W 压缩为一个 V V V 维向量,该向量被使用 B B B 比特量化为码字,而解码器从码字重构 W \mathbf{W} W。
使用虚拟信道 H ~ \widetilde{\mathcal{H}} H 的 DL 优化目标由下式给出
Θ ˙ = ( Θ ˙ E , Θ ˙ D ) = argmin Θ E H ~ { L ( W ~ , f a ( W ~ ; Θ ) ) } , (6) \dot{\Theta} = (\dot{\Theta}_{\text{E}}, \dot{\Theta}_{\text{D}}) = \text{argmin}_{\Theta} \mathbb{E}_{\widetilde{\mathcal{H}}} \left\{ L(\widetilde{\mathbf{W}}, f_a(\widetilde{\mathbf{W}}; \Theta)) \right\}, \tag{6} Θ˙=(Θ˙E,Θ˙D)=argminΘEH {L(W ,fa(W ;Θ))},(6)
其中 L ( ⋅ ) L(\cdot) L(⋅) 是均方误差(MSE)损失函数, E H ~ { ⋅ } \mathbb{E}_{\widetilde{\mathcal{H}}}\{\cdot\} EH {⋅} 表示在 H ~ \widetilde{\mathcal{H}} H 上的平均值。为了弥合虚拟与 RW 环境之间的差距,采用了 OL 来微调模型。由于 UE 端的电池寿命、计算负载和有限资源等限制,OL 主要在 BS 端通过仅微调解码器 f d ( ⋅ ) f_d(\cdot) fd(⋅) 来进行。微调目标是
Θ ¨ D = argmin Θ D E H { L ( W , f a ( W ; Θ ˙ ) ) } , (7) \ddot{\Theta}_{\text{D}} = \text{argmin}_{\Theta_{\text{D}}} \mathbb{E}_{\mathcal{H}} \left\{ L(\mathbf{W}, f_a(\mathbf{W}; \dot{\Theta})) \right\}, \tag{7} Θ¨D=argminΘDEH{L(W,fa(W;Θ˙))},(7)
其中 Θ ˙ \dot{\Theta} Θ˙ 初始化自虚拟信道训练。值得注意的是,这种 OL 方法引入的通信和计算开销极小,因为编码器保持固定,仅解码器在 BS 端进行重训练。
B. DT 中的虚拟信道
虚拟信道 H ~ \widetilde{\mathcal{H}} H 是利用 Wireless InSite® 射线追踪仿真生成的,该仿真通过详细的 3D 模型复制了 RW 环境,精确地对反射面、BS/UE 位置和方向进行了建模。UE 移动区域(图 2(a) 中的红点)以 0.5 米的间隔进行离散化,每个 UE 的方向从 100 个可能的方向中随机选取。在微波暗室中测量的天线属性保证了仿真结果的真实性。基于提取的传播参数,虚拟信道的计算如下。
利用射线追踪传播参数,根据式 (4) 计算 BS 与 UE 之间的信道,并通过式 (1) 导出相应的虚拟预编码矩阵。仿真波形设计与 RW 场景相匹配,从而建立了室内 DT 数据集。
为了评估基于 DL 的 CSI 反馈模型的鲁棒性,我们在包括不同环境和天线配置在内的各种条件下生成了额外的虚拟信道。构建了一个复现 NSYSU 校园的室外虚拟场景(图 2(d)-(e)),其中 BS 位于建筑物上方 50 50 50 米处,UE 以 2 2 2 米的间隔分布在校园广场上。该仿真产生了室外 DT 数据集。
这一段主要描述了为了验证模型在不同场景下的通用性(即鲁棒性),作者除了建立室内模型外,还专门构建了一个室外数字孪生(DT)场景。通过这个仿真,作者得到了一个独立于室内数据的“室外数据集”。这通常用于后续实验中的“跨场景验证”或者“混合训练”,以证明提出的算法不局限于特定环境。

Fig. 2.
- (a) 使用 Wireless InSite® 模拟的 NSYSU 室内走廊。
- (b) BS 和 UE 的 RW 测量点位置。
- ( c ) (c) (c) 实验测量场景。
- (d) NSYSU 校园的卫星图像。
- (e) 使用 Wireless InSite® 模拟的 NSYSU 校园室外场景。
- (f) 用于 CSI 反馈实验的 BS 处 15 15 15 cm x 15 15 15 cm 贴片天线(patch antenna)。
- (g) 用于 CSI 反馈实验的 UE 处 7 7 7 cm x 15 15 15 cm 贴片天线(patch antenna)。
- (h) 用于信道保真度实验(channel fidelity experiment)的 BS 处 11.4 11.4 11.4 cm 偶极子天线(dipole antenna)。
- (i) 用于信道保真度实验的 UE 处 15.5 15.5 15.5 cm x 17 17 17 cm 贴片天线。
C. 虚拟信道的保真度
为了评估虚拟信道的保真度,我们将来自 DT 的仿真 AoA 与在 NSYSU 室内走廊中测量的 RW AoA 进行了比较(图 2(a)-(b))。由于标准天线(图 2(f)-(g))对于 AoA 提取并非最优,因此在 BS 处使用了垂直偶极子(图 2(h)),而在接收机处使用了具有半波长间距的 7 贴片阵列(图 2(i))作为替代。
| 设备位置 | 天线类型 | 核心功能 | 比喻 |
|---|---|---|---|
| BS (发射) | 垂直偶极子 | 全向激发:确保环境中所有的反射面都被信号覆盖到,不留死角。 | 灯泡:照亮整个房间。 |
| UE (接收) | 贴片阵列 | 角度分辨:利用多个天线间的相位差来“看”出信号是从哪个方向来的。 | 双耳/复眼:通过两只耳朵的时间差辨别声音方位。 |
AoA 是根据接收到的平面波的相位差计算得出的。DT AoA 由 3D 方向向量 u ( ϕ , θ ) = [ cos ( ϕ ) cos ( θ ) , cos ( ϕ ) sin ( θ ) , sin ( ϕ ) ] T \mathbf{u}(\phi, \theta) = [\cos(\phi)\cos(\theta), \cos(\phi)\sin(\theta), \sin(\phi)]^{\mathrm{T}} u(ϕ,θ)=[cos(ϕ)cos(θ),cos(ϕ)sin(θ),sin(ϕ)]T 表示,其中 θ \theta θ 和 ϕ \phi ϕ 分别表示方位角和仰角。估计的 AoA 同样用 ( ϕ ^ , θ ^ ) (\hat{\phi}, \hat{\theta}) (ϕ^,θ^) 表示,两者之间的相似度通过内积来衡量
η = ⟨ u ( ϕ , θ ) , u ( ϕ ^ , θ ^ ) ⟩ , − 1 ≤ η ≤ 1. (8) \eta = \langle \mathbf{u}(\phi, \theta), \mathbf{u}(\hat{\phi}, \hat{\theta}) \rangle, -1 \leq \eta \leq 1. \tag{8} η=⟨u(ϕ,θ),u(ϕ^,θ^)⟩,−1≤η≤1.(8)
选择了五个测量点(A4, D4, F4, G 和 H;见图 2(b)),其中 A4, D4 和 F4 位于强信号区域,而 G 和 H 位于较弱区域。表 I 列出了主要(最强增益)和次要(第二强)路径的相似度值,表明 DT 和 RW 传播路径之间具有高度相似性。

由于预编码器 W \mathbf{W} W 是 EVCsiNet 的主要输入,我们进一步使用预编码器余弦相似度来比较场景相似度。图 3 显示,对于相对于 BS 在同一方向上排列的位置,DT 和 RW 数据集都表现出很高的相似度。这些发现,无论从 AoA 还是预编码器的角度来看,都验证了 DT 数据集有效地反映了 RW 条件。

尽管 DT 数据集非常接近 RW 条件,但由于实际天线效应,仍然存在一些差异。因此,OL 是必要的。对于 OL,如式 (7) 所示,需要 RW 预编码矩阵数据 W \mathbf{W} W。为了平衡性能和数据收集成本,随机选择了图 2(b) 中 30 % 30\% 30% 的 RW 测量点。此外,为了最大化从有限测量中提取的信息,将 1 , 620 1,620 1,620 个子载波分为 60 60 60 个子带,每个子带包含 27 27 27 个连续的子载波。这种配置使得每个测量点能够为 OL 生成 60 60 60 个不同的预编码矩阵,从而以最少的数据收集增强模型适应性。
A. Performance of the DT-Trained Model in RW Scenarios

表 II 比较了各种 CSI 反馈方法的预编码矩阵重构性能(第四列)。其中,
- 具有 4 个波束的 Type II 方法实现了最高的重构性能( ρ = 0.96 \rho = 0.96 ρ=0.96),但需要最多的反馈比特( 80 80 80 比特)。
- 值得注意的是,带有 OL 的 Indoor EVCsiNet 实现了与具有 3 个波束的 Type II 方法相当的重构性能(即 ρ = 0.82 \rho = 0.82 ρ=0.82 对比 0.86 0.86 0.86),同时显著降低了开销( 32 32 32 比特对比 58 58 58 比特)。
尽管将 Indoor EVCsiNet 直接应用于 RW 场景会产生次优的性能,但它仍然优于 Outdoor 和 CDL 变体。通过 OL,Indoor EVCsiNet 进一步提升并在与其他两者的比较中保持明显的优势。这些结果表明,
- 基于 DT 的预训练通过减少域不匹配(reducing domain mismatch)提供了更好的初始化,并显著增强了 OL 的有效性。
- 相比之下,基于 CDL 的预训练后接 OL 对于在 RW 条件下实现鲁棒的 CSI 重构仍然不足。
CDL 是 Clustered Delay Line (簇延迟线)
图 4 比较了 Indoor EVCsiNet 与其他 CSI 反馈方法在 RW 场景中的反馈开销和吞吐量。应用 OL 为 Indoor EVCsiNet 带来了 17 17 17 Mbps 的吞吐量增长,实现了与具有 3 个波束的 Type II 方法相当的性能。

有趣的是,尽管 Indoor EVCsiNet 表现出较低的相似度,但在吞吐量方面优于具有 2 个波束的 Type II 方法。这种差异归因于具有 2 个波束的 Type II 方法的不平衡性能;仅使用 2 个波束时,对应于每个最大特征值的预编码器无法被准确重构,这阻碍了 BS 通过主特征信道有效传输信号的能力。相比之下,EVCsiNet 以平衡的性能重构每个预编码器,避免了这个问题。
技术解释:为何“低分”反而“高能”?(平衡性 vs. 偏科)
文中提到的“不平衡性能 (Unbalanced Performance)”揭示了 MIMO 系统吞吐量的关键:能否利用多条通道并行传输。
- MIMO 的核心逻辑
- 多车道原理: MIMO 就像一条多车道的高速公路。要达到最高吞吐量(车流量),必须确保 每一条车道(特征信道) 都能通车,而不仅仅是把最宽的那一条修好。
- Type II ( N = 2 N=2 N=2) —— “偏科生”
- 局限: 受限于只能选 2 个波束,资源紧缺。
- 策略: 它把所有资源都用来精确描述主路径(第一特征向量),导致**辅路径(第二特征向量)**被牺牲或描述得很差。
- 后果:分数高,主路径很完美,所以数学上的相似度 ( ρ \rho ρ) 看起来不错。
- 网速慢: 因为辅路径“断了”,基站无法有效地进行多流传输(只能跑单流),总吞吐量受损。
- EVCsiNet —— “全能生”
- 策略: 自动编码器进行的是整体压缩。它试图在有限的 32 bit 内,均衡地恢复整个矩阵的结构。
- 后果: 分数低,细节上可能不如前者完美,导致相似度 ( ρ \rho ρ) 略低。
- 网速快: 它同时兼顾了主路径和辅路径的恢复。“两条路都能走”比“只有一条路完美”更能带来高吞吐量。
更多推荐



所有评论(0)