An ESPRIT-Based Supervised Channel Estimation Method Using Tensor Train Decomposition for mmWave 3-D

—本文关注毫米波三维多输入多输出正交频分复用 (mmWave 3D MIMO-OFDM) 系统的下行链路监督信道估计问题（supervised channel estimation problem），其中发射机和接收机均配备均匀矩形阵列 (URAs)。基于稀疏散射特性，毫米波信道被建模为低秩高阶张量。

WHS-_-2022

404人浏览 · 2025-12-11 00:27:54

WHS-_-2022 · 2025-12-11 00:27:54 发布

摘要——本文关注毫米波三维多输入多输出正交频分复用 (mmWave 3D MIMO-OFDM) 系统的下行链路监督信道估计问题（supervised channel estimation problem），其中发射机和接收机均配备均匀矩形阵列 (URAs)。基于稀疏散射特性，毫米波信道被建模为低秩高阶张量。

通过将信道和接收到的训练信号公式化为张量，提出了一种基于 ESPRIT 的快速范德蒙 (Vandermonde) 结构张量分解方法，以估计涉及到达角和出发角 (AoAs/AoDs)、延迟和路径增益的信道参数。具体而言，我们

首先建立了张量列 (TT) 模型与高阶张量 CANDECOMP/PARAFAC (CP) 信号模型之间张量秩的关系。
然后，利用 TT 分解来估计信号子空间并推导旋转不变方程，该方程利用了信号的高阶张量低秩性和频域中的范德蒙结构。
基于推导出的解析估计误差，提供了理论证明（theoretical justifications）以揭示使用 TT 分解的优势。
此外，我们将所提出的方法以迭代方式进行了扩展，以追求更高的精度。根据我们的仿真结果，与最先进的技术相比，所提出的方法实现了更高的估计精度（同时针对信道参数和整个信道）。
此外，在实验中与当前最佳的迭代算法相比，最多可以节省 87% 的计算时间。

索引词——信道估计，张量分解，毫米波，3D MIMO-OFDM。

文章目录

I. INTRODUCTION

大多数现有工作主要集中在低阶信道张量估计上，并认为发射机和接收机都配备了一维均匀线性阵列 (ULAs)。基于压缩感知 (CS) 理论的解决方案将信道估计视为稀疏信号恢复问题，以利用信道稀疏性。

通过在角度域中呈现稀疏信道，文献 [14] 中提出了一种基于 CS 的信道估计算法，该算法利用子载波之间的共同稀疏性来处理多维信道结构。
此外，通过制定张量正交匹配追踪 (T-OMP) 估计器，文献 [15] 中提出了直接张量 CS 模型。
另一方面，估计方法可以直接利用信道张量的低秩性。由于信道可以通过低秩 CANDECOMP/PARAFAC 分解 (CPD) 模型 [16] 来描述，
文献 [4] 中提出了一种 CP 交替最小二乘 (CPALS) 算法来分解每个信道维度的因子，并对每个因子执行信道参数估计。然而，基于 ALS 的方法需要大量迭代来估计多维信道，这通常很耗时。

快速且准确的信道估计方法是人们所渴望的，因为它们可以节省终端能耗，减少延迟并应对信道变化。低维基于子空间的技术可用于计算张量 CPD，以实现准确的大规模 MIMO 信道估计 [17], [18]。由于信道张量的因子具有范德蒙 (Vandermonde) 结构，因此提出了快速且非迭代的信道估计方案，以采用通过旋转不变技术估计信号参数 (ESPRIT) 类技术 [19] 或其多维扩展（their multidimensional extensions） [20], [21], [22]。

在文献 [5] 中，通过利用频域和空域中的平移不变关系，开发了基于结构化 CPD (structured CPD，SCPD) 的信道估计算法用于 MIMO-OFDM 系统。
此外，假设波束成形矩阵是中心厄米特 (central-Hermitian) 的，文献 [23] 中制定了一种实值 SCPD 估计方法以降低计算复杂度。虽

然文献 [5], [21] 中基于子空间的方法可以直接应用于高阶 3D MIMO-OFDM 信道估计，但在 3D MIMO 系统中，使用矩阵分解来估计信号子空间无法利用高阶张量信号的低秩性。

基于 Tucker 分解模型 [24]，文献 [20] 中提出了一种基于张量的子空间估计方法，其中使用高阶奇异值分解 (HOSVD) 来利用低秩结构进行子空间估计。

然而，如果路径数量大于信号的典型尺寸，它会退化为基于矩阵的方法，并且无法从张量结构中获得增益。

最近，张量列 (TT) 模型在

降低计算 CPD 的复杂度 [25]
和表征高阶张量的低秩性（low-rankness of higher-order tensors） [26], [27] 方面显示出其优越性。
在文献 [28] 中，我们之前的工作已经证明，在全数字双极化 MIMO 系统中，与基于 Tucker 的估计相比，基于 TT 的张量信道估计在实现高精度和快速度方面均具有优越性。

在本文中，我们考虑具有混合模拟-数字架构的毫米波 3D MIMO-OFDM 系统，其中基站 (BS) 和移动台 (MS) 均配备有 URAs。我们提出了一种基于张量列的快速范德蒙 (Vandermonde) 结构 CPD（tensor-train-based Vandermonde-structured CPD，TTVCPD）信道估计方法，该方法结合了基于 ESPRIT 的技术以利用频域内的范德蒙结构。具体而言，我们

首先将导频辅助训练信号公式化为高阶 CP 张量，并建立 TT 模型与流行的 CP 信号模型之间张量秩的关系。
然后，我们提出使用 TT 分解来估计子空间，该方法利用了信号张量的高阶低秩性，并推导出了平移不变方程。
我们为所提出的算法提供了关于子空间和时延估计误差的显式一阶展开、唯一性条件（即路径数的可分辨上界）以及计算复杂度的理论分析。
与使用矩阵分解（matrix decomposition）的现有 ESPRIT 类型方法 SCPD [5] 相比，所提出的 TTVCPD 受益于高阶张量低秩性，并利用 TT 分解开发了信号子空间的多线性结构（multi-linear structure of the signal subspace），这带来了理论上的性能提升。
根据我们的数值实验，它在信道参数和重构信道上都实现了更高的估计精度。
此外，为了以计算复杂度可承受的增加为代价产生更高的估计精度，我们开发了 TTVCPD 的迭代版本 (iTTVCPD)。受良好初始化有助于加速 CPALS 并找到极小值 [16], [29] 这一点的启发，我们通过使用 TTVCPD 的输出作为 ALS 算法的初始化来制定 iTTVCPD，这与由 SVD 初始化 [4] 的 CPALS 方法不同。实验结果表明，所提出的 iTTVCPD 算法实现了更低的估计误差，但节省了高达 87% 的计算时间。

IV. CHANNEL ESTIMATION METHODS

A. The Proposed Tensor-Train-Based Vandermonde Structured CPD (TTVCPD) Method

V. SIMULATIONS

2) Evaluation Settings:

张量运算基于 Tensorlab 工具箱³ 编写。在所提出的 TTVCPD 算法中，空间平滑参数设置为 $J_0 = 0.7 M$ 。在 iTTVCPD 算法中，容差设置为 $\epsilon = 10^{-2}$ ，因为我们发现如果使用更小的容差，增益非常有限。所提出的算法与通过 SVD⁴ [4] 初始化的 CPALS 方法以及 SCPD 方法 [5] 进行了比较。

请注意，这两种竞争方法的原始版本用于 ULA-ULA 情况，我们将它们扩展到了 URA-URA 情况。

对于基于 CPALS 的信道估计，收敛容差 $\epsilon$ 分别设置为 $10^{-4}$ 和 $10^{-8}$ ，以评估复杂度和精度之间的权衡。对于 $\boldsymbol{\mathcal{Y}}_{\text{aug}} \in \mathbb{C}^{7 \times 2 \times 3 \times 4 \times 4 \times 4}$ ，其中 $M = 10$ 且 $R = 4$ ，公式 (27) 导出所有 TT 秩都等于 4。本文不考虑基于 Tucker 模型 [20] 的张量 ESPRIT，因为它仅利用了 $\mathbf{Y}_{\text{aug},\langle 1 \rangle}$ 的低秩性，而这已经包含在 TT 模型中。对于 CPALS 和 iTTVCPD，最大迭代次数均设置为 $K_{\max} = 10000$ 。所有实验均在一台使用 MATLAB 的计算机上进行，该计算机配置为 Intel® Core™ i7-10510 U 2.30 GHz CPU 和 12G RAM。生成了 100 种不同的随机仿真配置，并且对于每种配置，使用不同的噪声种子运行 200 次蒙特卡洛试验。因此，总共有 20000 次试验用于评估。对于每次试验，假设噪声张量由 $\boldsymbol{\mathcal{N}} = \sigma \boldsymbol{\mathcal{N}}_0$ 生成，其中 $\boldsymbol{\mathcal{N}}_0$ 的元素服从独立同分布 (i.i.d.) $\mathcal{CN}(0, 1)$ ，且 $\sigma$ 由信噪比 (SNR) 决定，即 $\sigma = 10^{-\frac{\text{SNR}}{20}} \frac{\|\boldsymbol{\mathcal{Y}}\|_F}{\|\boldsymbol{\mathcal{N}}_0\|_F}$ 。所有试验的平均 NMSE 用于评估信道估计性能，即

$\text{NMSE}(\hat{\boldsymbol{\mathcal{H}}}, \boldsymbol{\mathcal{H}}) = \frac{\|\hat{\boldsymbol{\mathcal{H}}} - \boldsymbol{\mathcal{H}}\|_F^2}{\|\boldsymbol{\mathcal{H}}\|_F^2},$

其中 $\hat{\boldsymbol{\mathcal{H}}}$ 和 $\boldsymbol{\mathcal{H}}$ 分别表示在频域中堆叠所有训练子载波级信道后的估计信道和实际信道。类似地，我们分别计算估计的 AoDs、AoAs、延迟和路径增益的平均 NMSE。由于参数估计结果中存在排列模糊性，我们在按升序对实际值和估计值进行排序后报告它们的 NMSE。

3) Asymptotic Results of Subspace and Delay Estimations

我们首先展示在第四章 B 节中推导出的用于解析性能评估的渐近行为。在图 4 中，我们将使用 TT 奇异值分解 (TTSVD) 进行子空间估计的解析 NMSE（如定理 4 中给出）与使用矩阵 SVD 进行的子空间估计进行了比较。

在这里插入图片描述

结果表明，使用 TTSVD 求解 (24) 进行信号子空间估计比使用 SVD 求解 (23) 产生更小的误差，因为 TT 分解通过利用信号张量的高阶张量低秩性（by exploiting the higher-order tensor low-rankness of the signal tensor）带来了去噪效果。此外，我们将基于定理 5 的时延估计的解析 NMSE 与蒙特卡洛试验获得的经验估计误差进行了比较。

在这里插入图片描述

在图 5 中，我们对基于 SVD 的 ESPRIT 和基于 TTSVD 的 ESPRIT 之间的时延估计进行了比较。我们可以观察到，随着信噪比 (SNR) 的增长，两种方案的经验结果和解析结果都收敛，这表明推导出的解析误差是渐近准确的。此外，基于 TTSVD 的解析误差总是小于基于 SVD 的解析误差，因为更准确的信号子空间带来了时延估计的改进。在仿真中，我们使用 TTADC-U 算法 [38] 来计算 TT 分解，以便与 CPALS 竞争。

4) Iterative Results of iTTVCPD

这里我们展示 iTTVCPD 相比于 TTVCPD 的改进。为了展示 ALS 算法在 TTVCPD 上的性能提升，我们在图 6 中绘制了信道估计 NMSE 与迭代次数 $K$ 的关系，其中我们可以观察到，具有 $K > 0$ 的 iTTVCPD 总是优于具有 $K = 0$ 的 TTVCPD 初始化。

在这里插入图片描述

5) Results With Different SNRs

我们在图 7 和图 8 中展示了 NMSE 与 SNR（从 5 dB 到 30 dB）的关系结果。在图 7(a) 中，我们观察到所提出的 TTVCPD 在估计时延方面优于 CPALS 方法和 SCPD 方法。在图 7(b) 到 (e) 中，所提出的 TTVCPD 在估计其他参数方面比 SCPD 实现了更低的 NMSE。TTVCPD 和 SCPD 均基于非迭代 ESPRIT 方案，但 TTVCPD 受益于利用信号的高阶低秩性。

在这里插入图片描述

如图 8 所示，TTVCPD 的估计信道 NMSE 高于 CPALS ( $\epsilon = 10^{-8}$ )。根据方程 (38)，使用 TT 模型的增益直接反映在第一个估计参数即时延上。然而，由于参数顺序估计中的误差累积效应，与 CPALS ( $\epsilon = 10^{-8}$ ) 的并行估计方案相比，这种增益在估计其他参数时可能会降低，这可以在 SNR = 30 dB 时的图 7(b) 和 $(\text{c})$ 中观察到。尽管如此，如图 7 和 8 所示，iTTVCPD 弥补了性能损失并实现了最高的估计精度。

在这里插入图片描述

在图 9 中，为了进行全面比较，我们展示了在不同 SNR 下所有方法的 NMSE 与计算时间的关系。在 SNR = 30 dB 的情况下，我们可以看到 iTTVCPD 实现了最低的误差，计算时间仅为 0.019 s，这是 CPALS ( $\epsilon = 10^{-8}$ )（即 0.148 s）的 12.8%。

虽然 CPALS ( $\epsilon = 10^{-4}$ ) 的运行时间与非迭代方法的运行时间处于同一数量级，但它大大降低了估计精度。此外，图 9 显示，较低的 SNR 几乎不影响 SCPD、TTVCPD 和 iTTVCPD 的复杂度，而会略微增加 CPALS 的时间消耗。

8) Results Compared With the Sparse-Based Method

这里我们将基于低秩的方法与基于稀疏的方法的信道估计性能进行了比较。根据 (17)，通过使用扩展虚拟信道模型 [9]，接收到的训练信号可以表示为 $\mathbf{y}_m = \mathbf{\Phi} \mathbf{\Psi} \mathbf{s}_m$ ，其中 $\mathbf{y}_m = \text{vec}(\mathbf{Y}_m)$ 且 $\mathbf{s}_m$ 是稀疏表示。 $\mathbf{\Phi} = (\mathbf{B}_4 \otimes \mathbf{B}_3 \otimes \mathbf{B}_2 \otimes \mathbf{B}_1)^T \in \mathbb{C}^{J_1 J_2 J_3 J_4 \times I_1 I_2 I_3 I_4}$ 和 $\mathbf{\Psi} = (\mathbf{D}_4 \otimes \mathbf{D}_3 \otimes \mathbf{D}_2 \otimes \mathbf{D}_1)^T \in \mathbb{C}^{I_1 I_2 I_3 I_4 \times \bar{I}_1 \bar{I}_2 \bar{I}_3 \bar{I}_4}$ 分别被称为具有网格数 $\{\bar{I}_n\}_{n=1}^4$ 的测量矩阵和字典矩阵。由于 AoAs/AoDs 独立于频率，我们使用同步加权正交匹配追踪 (SW-OMP) 方法 [14] 来利用所有 $\mathbf{s}_m$ （其中 $\dots, M$ ）的公共支持。我们将稀疏度设置为 4，并生成 $\{\mathbf{D}_n\}_{n=1}^4$ 作为 DFT 矩阵，其中 $\bar{I}_n = 15$ 对于 $\dots, 4$ 。

在这里插入图片描述

在图 17 中，我们展示了估计训练信道的 NMSE 结果。我们可以看到，与所有其他无网格方法相比，SW-OMP 遭受了严重的网格离散化误差。此外，由于对大矩阵 $\mathbf{\Psi} \in \mathbb{C}^{1024 \times 50625}$ 的操作，它需要大量的计算时间。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【2025年生成式引擎优化（GEO）白皮书，内容破局是关键】

2048 AI社区

AI Agent在智能城市噪声管理中的实践

随着城市化进程的加速，城市噪声污染问题日益严重，对居民的生活质量和健康造成了负面影响。智能城市的发展为解决噪声管理问题提供了新的思路和技术手段。本文的目的是探讨AI Agent在智能城市噪声管理中的应用实践，研究如何利用AI Agent的自主决策和学习能力，实现对城市噪声的有效监测、分析和控制。研究范围涵盖了AI Agent的基本原理、相关算法，以及在智能城市噪声管理中的具体应用场景和实现方法。