Unsupervised Learning for Gain-Phase Impairment Calibration in ISAC Systems

—增益相位损伤（Gain-phase impairments，GPIs）会影响 6G 通感一体化 (ISAC) 中的通信和感知功能。我们研究了单输入多输出正交频分复用 ISAC 系统中 GPIs 的影响，并开发了一种基于模型的无监督学习方法（model-based unsupervisedlearning approach），以同时。

WHS-_-2022

1092人浏览 · 2025-12-24 14:36:40

WHS-_-2022 · 2025-12-24 14:36:40 发布

摘要——增益相位损伤（Gain-phase impairments，GPIs）会影响 6G 通感一体化 (ISAC) 中的通信和感知功能。我们研究了单输入多输出正交频分复用 ISAC 系统中 GPIs 的影响，并开发了一种基于模型的无监督学习方法（model-based unsupervised
learning approach），以同时

$(i)$ 估计增益相位误差（gain-phase errors）
以及 $(ii)$ 定位感知目标。

所提出的方法基于针对单个目标的最佳最大后验比检验（optimal maximum a-posteriori ratio test）。结果表明，所提出的方法能够有效地估计增益相位误差，并能获得与损伤完全已知时相近的位置估计性能。

关键词——GPIs，正交频分复用，基于模型的学习，无监督学习。

文章目录

I. INTRODUCTION

通感一体化 (ISAC) 被认为是第六代无线系统 (6G) [1] 的关键赋能技术，它将感知和通信功能结合在单个设备中，从而为通信系统提供感知能力，同时也提高了无线信道的使用效率和系统性能 [2]。ISAC 中的信号处理主要由基于模型的算法驱动（model-based algorithms），这些算法提供性能保证（performance guarantees）、可解释性（explainability）和可预测的计算复杂度（predictable computational complexity） [3]–[7]。然而，6G 中预期的更高载波频率以及感知与通信网络的融合增加了硬件损伤的可能性，例如天线畸变（antenna distortions）、相位噪声（phase noise）和采样抖动（sampling jitter） [8], [9]。这些硬件损伤导致基于模型的算法出现模型失配，从而降低其性能。

深度学习 (DL) 已被成功应用于缓解 ISAC 中的硬件损伤 [10]–[13]，但它缺乏可解释性（lack of interpretability）。
相比之下，基于模型的机器学习 (model-based machine learning，MB-ML) 通过参数化标准的基于模型的算法（parameterizing standard model-based algorithms），提供了可解释的解决方案（provides interpretable solutions），增强了其对失配模型的适应性（their adaptability to mismatched models），同时提供了性能保证 [14]。

MB-ML 已被应用于通信 [15]–[18]、感知 [19]–[21] 和 ISAC 场景 [22]。硬件损伤缓解方案（例如 [20]–[22]）依赖于监督学习 (supervised learning，SL)，这涉及获取环境中物体地面真值位置的困难或耗时过程。无监督学习 (Unsupervised learning，UL) 避免了标签数据，并已被用于 [23] 中的 ISAC 天线间距损伤缓解（inter-antenna spacing impairment），尽管仍需要少量标签数据集来完全补偿损伤。

在本文中，我们在 MB-ML 框架下开发了一种 UL 方法，以联合补偿天线增益相位损伤 (antenna gain-phase impairments，GPIs) 并估计目标位置。作为概念验证，我们专注于基于正交频分复用 (OFDM) 信号执行单目标检测和位置估计的简单单站单输入多输出 (SIMO) 雷达（见图 1）。GPI 缓解是一个重要问题，已有基于模型的 [24]–[26]、DL [27], [28] 和 MB-ML 解决方案 [17], [18]。

然而，[24], [25] 至少需要一个处于已知角度的发射机来校准天线阵列，
[26] 假设了信道状态信息 (CSI) 的已知模型，这不适用于我们的情况，因为 CSI 包含待估计的目标位置。
在 [27] 中，仅执行了角度估计，
而 [28] 需要一个处于已知位置的发射机进行校准。
此外，[27], [28] 需要标签数据进行训练。
最后，虽然 [17], [18] 提出了 MB-ML UL 方法来补偿 GPI，但它们考虑的是纯通信系统和没有用户定位的 CSI 估计。

II. SYSTEM MODEL

我们考虑一个单站 SIMO-OFDM ISAC 收发机，配备单天线发射 (TX) 和 $N$ 个阵元的接收 (RX) 均匀线阵 (ULA)。RX ULA 的阵元间距为 $d_{\mathrm{R}}$ 。OFDM 信号的符号持续时间为 $T_{\mathrm{sym}} = T_{\mathrm{cp}} + T$ ，其中 $T_{\mathrm{cp}}$ 是循环前缀 (CP)， $T$ 是基本符号持续时间。具有 $S$ 个子载波且子载波间隔为 $\Delta_{\mathrm{f}} = 1/T$ 的复基带 OFDM 发射信号为 [29], [30]

$\frac{1}{\sqrt{S}} \sum_{s=0}^{S-1} x_s e^{j 2 \pi s \Delta_{\mathrm{f}} t} \mathrm{rect} \left( \frac{t}{T_{\mathrm{sym}}} \right), \tag{1}$

其中 $x_s$ 是第 $s$ 个子载波中的复发射符号。考虑到远场中存在一个静止的点目标，第 $n$ 个 RX 阵元处的无噪声接收基带信号为 [31]

$z_n(t) = \gamma [\boldsymbol{a}(\theta)]_n s(t - \tau) \tag{2}$

其中 $\gamma$ 是复信道增益， $\tau$ 是目标的总往返时延， $\theta$ 是到达角 (AOA)， $\boldsymbol{a}(\theta)$ 是阵列导向矢量，具有

$[\boldsymbol{a}(\theta)]_n = e^{-j 2 \pi n d_{\mathrm{R}} \sin(\theta) / \lambda}, n = 0, \ldots, N-1 \tag{3}$

其中 $\lambda$ 为载波波长。遵循标准 OFDM 假设，CP 被取为大于最远目标的往返时延，即 $T_{\mathrm{cp}} \ge \tau$ 。在 $T_{\mathrm{cp}} + lT/S$ 时刻对 $z_n(t)$ 进行采样，其中 $\ldots, S-1$ （即去除 CP 后），我们获得离散时间信号

$z_n[l] = \frac{\gamma}{\sqrt{S}} [\boldsymbol{a}(\theta)]_n \sum_{s=0}^{S-1} x_s e^{j 2 \pi s \frac{l}{S}} e^{-j 2 \pi s \Delta_{\mathrm{f}} \tau}, \tag{4}$

其中已知的相移 $\exp(j 2 \pi s \Delta_{\mathrm{f}} T_{\mathrm{cp}})$ 被吸收进 $x_s$ 中。对 $z_n[l]$ 进行 $S$ 点 DFT 得到频域基带信号为

$Z_{n,s} = \mathcal{F} \left\{ \{z_n[l]\}_{l=0}^{S-1} \right\} = \gamma [\boldsymbol{a}(\theta)]_n x_s [\boldsymbol{b}(\tau)]_s, \tag{5}$

其中 $[\boldsymbol{b}(\tau)]_s = \exp(-j 2 \pi s \Delta_{\mathrm{f}} \tau)$ 。在天线阵元和子载波上进行聚合，(5) 中的信号可以表示为

$\boldsymbol{Z} = \gamma \boldsymbol{a}(\theta) (\boldsymbol{b}(\tau) \odot \boldsymbol{x})^{\top} \in \mathbb{C}^{N \times S}, \tag{6}$

其中 $\boldsymbol{x} = [x_0 \cdots x_{S-1}]^{\top}$ 是发射符号矢量， $\odot$ 表示哈达玛积。

无 GPI 的观测： 在接收端添加噪声并考虑环境中随机存在的目标，得到最终模型 $^1$

$\boldsymbol{Y} = t \gamma \boldsymbol{a}(\theta) (\boldsymbol{b}(\tau) \odot \boldsymbol{x})^{\top} + \boldsymbol{W}, \tag{7}$

其中 $\in \{0, 1\}$ 表示目标的缺失或存在， $\boldsymbol{W}$ 表示加性高斯白噪声 (AWGN)，服从 $\mathrm{vec}(\boldsymbol{W}) \sim \mathcal{CN}(\boldsymbol{0}, N_0 \boldsymbol{I})$ ，其中 $\mathrm{vec}(\cdot)$ 为矢量化操作， $\boldsymbol{0}$ 为全零矢量， $\boldsymbol{I}$ 为单位矩阵。感知接收机的目标是基于 $\boldsymbol{Y}$ 检测目标的存在并估计其位置。

含 GPI 的观测（Observation with GPI）： 当 ULA 阵元受到 GPIs 影响时，ULA 的实际导向矢量为 $\boldsymbol{a}(\theta; \boldsymbol{\kappa}) = \boldsymbol{\kappa} \odot \boldsymbol{a}(\theta)$ ，其中 $\boldsymbol{\kappa} \in \mathbb{C}^N$ 是包含所有天线阵元 GPIs 的矢量。我们考虑 $\|\boldsymbol{\kappa}\|^2 = N$ ，以便在存在损伤的情况下发射机能量得以保持，即 $\|\boldsymbol{a}(\theta; \boldsymbol{\kappa})\|^2 = \|\boldsymbol{a}(\theta)\|^2 = N$ 。(7) 中的模型在 GPIs 下变为

$\boldsymbol{Y} = t \gamma (\boldsymbol{a}(\theta; \boldsymbol{\kappa})) (\boldsymbol{b}(\tau) \odot \boldsymbol{x})^{\top} + \boldsymbol{W}. \tag{8}$

接收机现在的目标是在未知 $\boldsymbol{\kappa}$ 的情况下进行操作。

$^1$ 在所考虑的 SIMO 模型下，通信接收机不受 GPI 的影响。由于这个原因以及篇幅限制，本文未评估通信性能。

$\begin{aligned} \|\boldsymbol{a}(\theta; \boldsymbol{\kappa})\|^2 &= \sum_{n=0}^{N-1} \left| [\boldsymbol{\kappa}]_n \cdot [\boldsymbol{a}(\theta)]_n \right|^2 \\ &= \sum_{n=0}^{N-1} |[\boldsymbol{\kappa}]_n|^2 \cdot \underbrace{|[\boldsymbol{a}(\theta)]_n|^2}_{1} \\ &= \sum_{n=0}^{N-1} |[\boldsymbol{\kappa}]_n|^2 \\ &= \|\boldsymbol{\kappa}\|^2 \end{aligned}$

III. PROPOSED METHOD

在下文中，我们将详细介绍用于执行目标检测和位置估计的考虑基准，以及所提出的用于补偿 GPIs 的无监督 MB-ML 方法。

A. Baseline

我们假设基准方法在固定的 $\boldsymbol{\kappa}$ 下运行，该值可能与真实的 GPIs 不一致。为了检测目标是否存在并估计其位置，我们采用最大后验比检验 (maximum a-posteriori ratio test，MAPRT) 检测器 [32]，它将广义似然比检验检测器（the generalized likelihood ratio test detector） [33] 推广到具有随机参数的情况，因此可以考虑关于 $\gamma$ 、 $\theta$ 和 $\tau$ 的先验信息。我们假设复信道增益服从正态分布，即 $\gamma \sim \mathcal{CN}(0, \sigma_\gamma^2)$ ，并且目标角度和距离被限制在一个先验已知的区域内，即 $\theta \sim \mathcal{U}[\theta_{\min}, \theta_{\max}]$ ， $\tau \sim \mathcal{U}[\tau_{\min}, \tau_{\max}]$ 。此外，我们假设 $p (t = 0) = p (t = 1) = 1/2$ 。对于固定的 $\boldsymbol{\kappa}$ ，MAPRT 得到以下最佳检验：

$\max_{\substack{\theta \in \mathcal{O} \\ \tau \in \mathcal{T}}} \left\{ |\boldsymbol{a}^{\mathrm{H}}(\theta; \boldsymbol{\kappa}) \boldsymbol{Y} (\boldsymbol{b}(\tau) \odot \boldsymbol{x})^*|^2 \right\} \gtrless \eta, \tag{9}$

其中 $\mathcal{O} = [\theta_{\min}, \theta_{\max}]$ ， $\mathcal{T} = [\tau_{\min}, \tau_{\max}]$ ， $(\cdot)^{\mathrm{H}}$ 表示共轭转置（conjugate transpose）运算， $(\cdot)^*$ 表示共轭运算， $|\cdot|$ 表示绝对值， $\eta$ 是控制检测概率和虚警概率的阈值。关于 MAPRT 推导的详细信息可以在附录 A 中找到。

$p (t = 0) = p (t = 1) = 1/2$ 表示系统假设目标不存在（ $t = 0$ ）和目标存在（ $t = 1$ ）的先验概率是相等的。

目标的角度和时延获取如下：

$(\hat{\theta}, \hat{\tau}) = \arg \max_{\substack{\theta \in \mathcal{O} \\ \tau \in \mathcal{T}}} \left\{ |\boldsymbol{a}^{\mathrm{H}}(\theta; \boldsymbol{\kappa}) \boldsymbol{Y} (\boldsymbol{b}(\tau) \odot \boldsymbol{x})^*|^2 \right\}. \tag{10}$

当假设的 $\boldsymbol{\kappa}$ 与实际 GPIs 匹配时，(9)、(10) 中的基准方法是最佳的，并且它代表了性能的下界，正如将在第四节中展示的那样。

B. 提出的 UL MB-ML 方法

我们将我们的方法建立在第 III-A 节的基准之上。具体来说，我们计算 角度-时延图 为

$\boldsymbol{M}(\hat{\boldsymbol{\kappa}}) = |\boldsymbol{\Phi}_{\theta}(\hat{\boldsymbol{\kappa}})^{\mathrm{H}} \boldsymbol{Y} (\boldsymbol{\Phi}_{\tau} \odot \boldsymbol{x} \mathbf{1}^{\top})^*|^2, \tag{11}$

其中 $\hat{\boldsymbol{\kappa}}$ 是 GPIs 的估计值， $\mathbf{1}$ 是全一矢量，并且

$\boldsymbol{\Phi}_{\theta}(\hat{\boldsymbol{\kappa}}) = [\boldsymbol{a}(\theta_1; \hat{\boldsymbol{\kappa}}) \ \boldsymbol{a}(\theta_2; \hat{\boldsymbol{\kappa}}) \ \cdots \ \boldsymbol{a}(\theta_{N_{\theta}}; \hat{\boldsymbol{\kappa}})] \tag{12}$

$\boldsymbol{\Phi}_{\tau} = [\boldsymbol{b}(\tau_1) \ \boldsymbol{b}(\tau_2) \ \cdots \ \boldsymbol{b}(\tau_{N_{\tau}})]. \tag{13}$

我们在均匀采样的二维网格上评估角度-时延图，其中 $N_{\theta}$ 和 $N_{\tau}$ 分别为角度和时延点的数量。根据角度-时延图，我们提出了两种不同的无监督损失函数（two different unsupervised loss functions）来学习 GPIs。

1) 最大化角度-时延图的最大值：

$\mathcal{J}(\hat{\boldsymbol{\kappa}}) = \mathbb{E}_{t, \gamma, \theta, \tau, \boldsymbol{x}, \boldsymbol{W}} \left[ - \max_{i,j} [\boldsymbol{M}(\hat{\boldsymbol{\kappa}})]_{i,j} \right], \tag{14}$

其中期望是针对 (8) 中 $\gamma, \theta, \tau, \boldsymbol{x}$ 和 $\boldsymbol{W}$ 的随机实现获取的。未知的 GPIs 会降低角度-时延图的幅度，因为角度-时延图的计算涉及 $|\boldsymbol{a}^{\mathrm{H}}(\theta; \hat{\boldsymbol{\kappa}})\boldsymbol{a}(\theta; \boldsymbol{\kappa})|^2$ ，该式仅当 $\hat{\boldsymbol{\kappa}} = \boldsymbol{\kappa}$ 时最大化。因此，我们期望通过最小化 (14)，我们提出的算法能够收敛到真实的损伤 $\boldsymbol{\kappa}$ 。关于损伤如何影响角度-时延图的详细信息将在第四节中展示。

优化习惯：在机器学习中，我们通常定义一个损失函数 (Loss Function) 并试图最小化 (Minimize) 它。

转换：最大化一个正数 $X$ ，等同于最小化 $- X$ 。

公式 (14) 实际上包含了 $\theta$ 和 $\tau$ 。公式 (14) 是： $\mathcal{J}(\hat{\boldsymbol{\kappa}}) = \mathbb{E} \left[ - \max_{i,j} [\boldsymbol{M}(\hat{\boldsymbol{\kappa}})]_{i,j} \right]$ 请注意这里的 $\boldsymbol{M}(\hat{\boldsymbol{\kappa}})$ 是一个二维矩阵（Angle-Delay Map）。矩阵的每一个元素 $[\boldsymbol{M}]_{i,j}$ 都对应着一个特定的角度 $\theta_i$ 和时延 $\tau_j$ 。当我们执行 $max_{i,j}$ 操作时，我们实际上是在问：“在所有的 $(\theta, \tau)$ 网格点中，哪一组参数让响应最大？”这个最大值出现的位置 $i^*, j^*)$ ，就是我们在公式 (10) 中显式写出的估计值 $(\hat{\theta}, \hat{\tau})$ 。所以，公式 (14) 可以被重写为： $\mathcal{J}(\hat{\boldsymbol{\kappa}}) \approx - \underbrace{\boldsymbol{M}(\hat{\boldsymbol{\kappa}}, \hat{\theta}, \hat{\tau})}_{\text{在最佳位置上的峰值}}$

2) 最小化接收观测信号的误差：

$\mathcal{J}(\hat{\boldsymbol{\kappa}}) = \mathbb{E}_{t, \gamma, \theta, \tau, \boldsymbol{x}, \boldsymbol{W}} [ \|\boldsymbol{Y} - \tilde{\boldsymbol{Y}}(\hat{\boldsymbol{\kappa}})\|_F ], \tag{15}$

其中 $\|\cdot\|_F$ 表示 Frobenius 范数，并且

$\tilde{\boldsymbol{Y}}(\hat{\boldsymbol{\kappa}}) = \hat{\gamma} \boldsymbol{a}(\hat{\theta}; \hat{\boldsymbol{\kappa}}) (\boldsymbol{b}(\hat{\tau}) \odot \boldsymbol{x})^{\top} \tag{16}$

是根据信道增益、角度和目标时延估计值重构的观测信号。关于 $\hat{\gamma}$ 的表达式在附录 A 中推导。 $^2$ 公式 (15) 背后的动机是观测信号 $\boldsymbol{Y}$ 受到真实 GPIs $\boldsymbol{\kappa}$ 的影响，而我们在 (16) 中使用估计的损伤 $\hat{\boldsymbol{\kappa}}$ 来重构观测信号 $\tilde{\boldsymbol{Y}}$ 。我们的假设是，通过最小化接收观测信号与重构信号之间的差异，学习到的损伤会收敛到真实损伤。

尽管 (10) 中 $\hat{\theta}$ 和 $\hat{\tau}$ 的计算涉及不可微操作，但可以计算 (15) 中损失相对于 $\hat{\boldsymbol{\kappa}}$ 的梯度，这一点在 [17] 中的类似方法中已经被观察到。

$^2$ $\hat{\gamma}$ 的估计假设已知 $N_0/\sigma_\gamma^2$ ，该值与信噪比 (SNR) 有关。在本文中，我们假设完全已知 $N_0/\sigma_\gamma^2$ ，但关于 SNR 估计方法，我们建议读者参考 [34], [35]。

在这里插入图片描述

在算法 1 中，我们总结了所提出的用于学习 GPIs 的无监督 MB-ML 算法。随机变量的分布在表 I 中突出显示。我们使用理想的增益相位系数初始化算法，即 $\boldsymbol{\kappa}^{(0)} = \mathbf{1}$ 。一旦我们根据算法 1 学习到了增益相位误差，我们就执行与 (9)、(10) 中的基准相同的操作进行推理，其中导向矢量 $\boldsymbol{a}^{\mathrm{H}}(\theta; \boldsymbol{\kappa})$ 被替换为带有学习到的损伤的导向矢量 $\boldsymbol{a}^{\mathrm{H}}(\theta; \boldsymbol{\kappa}^{(I)})$ 。

IV. RESULTS

在本节中，我们将详细介绍所考虑的仿真参数，并展示感知结果 $^3$ ，以评估所提出的学习方法的有效性。

A. Simulation Parameters

表 I 列出了仿真参数，其中我们考虑通信符号 $[\boldsymbol{x}]_s$ 是从正交相移键控 (QPSK) 星座图中随机抽取的，且 $\angle(\cdot)$ 表示复数值的相位。信噪比定义为 $\mathrm{SNR} = \mathbb{E}[\|\gamma(\boldsymbol{a}(\theta)(\boldsymbol{b}(\tau) \odot \boldsymbol{x})^{\top})\|_F^2]/N_0 = \sigma_\gamma^2 N S/N_0$ 。GPIs 的幅度和相位是从 [36] 中详述的分布中抽取的。为了评估 (9) 和 (10) 中需要最大化的目标函数，我们对角度和时延执行均匀的二维网格搜索，类似于 (11)。在训练过程中，我们利用了 Adam 优化器 [37]。

系统最终用于检测目标的“有效信噪比”就是： $\text{Total SNR} = \underbrace{\frac{\sigma_\gamma^2}{N_0}}_{\text{单点SNR}} \times \underbrace{N}_{\text{空间增益}} \times \underbrace{S}_{\text{频率增益}} = \frac{\sigma_\gamma^2 N S}{N_0}$
这么做是因为，在做目标检测（Detection）时，决定检测概率 ( $P_D$ ) 和虚警概率 ( $P_{FA}$ ) 的核心指标通常是 “总信号能量与噪声功率谱密度的比值” ( $E/N_0$ )。

B. Impact of GPIs

为了理解忽略 GPIs 如何影响感知性能，我们在图 2 中绘制了在完全已知 GPIs（即 $\hat{\boldsymbol{\kappa}} = \boldsymbol{\kappa}$ ，左图）和假设无损伤（即 $\hat{\boldsymbol{\kappa}} = \mathbf{1}$ ，右图）情况下的角度-时延图。(8) 中的信道模型包含了一个损伤实现 $\boldsymbol{\kappa} \neq \mathbf{1}$ 。可以看出，忽略 GPIs 会改变角度-时延图最大值的位置，从而影响 (10) 中的检验。此外，图 2 中的角度-时延图是相对于完全已知 GPIs 时的角度-时延图的最大值（左图）进行归一化的，这意味着与完全已知 GPIs 相比，忽略 GPIs 还会降低角度-时延图的最大幅度（正如第 III-B 节中所述）。

在这里插入图片描述

C. Sensing Results

在图 3 中，我们展示了测试感知结果，其中我们比较了：

$(i)$ 当 $\boldsymbol{\kappa}$ 与真实损伤匹配时第 III-A 节的基准方法（蓝色），
$(ii)$ $\boldsymbol{\kappa} = \mathbf{1}$ 时的基准方法（黑色），
以及 $(iii)$ 第 III-B 节中提出的方法，该方法使用学习到的损伤 $\boldsymbol{\kappa} = \boldsymbol{\kappa}^{(I)}$ ，
分别使用 (14) 中的损失（绿色）和 (15) 中的损失（红色）。

在这里插入图片描述

图 3 中的结果是对 100 次 GPIs 实现取平均得到的。图 3 的结果表明，所提出的无监督学习方法可以收敛到与 ULA 真实损伤相似的 GPI 矢量，并获得与损伤完全已知时相似的性能。这证实了第 III-B 节关于所提出的损失函数有效性的假设（This confirms the hypothesis of Sec. III-B about
the effectiveness of the proposed loss functions.）。

此外，使用损失 (14) 和 (15) 的算法性能非常相似，这可以通过附录 A 的推导来解释。(15) 中的损失类似于 (20) 中需要最小化的目标，而 (14) 中的损失类似于 (25)。(20) 和 (25) 均源自 (18) 中相同的 MAPRT 目标。图 3 的结果表明，最小化 (14) 或 (15) 是等效的。(14) 的优势在于它不需要 SNR 的知识，而 (15) 可以更容易地推广到多目标情况，并嵌入到诸如正交匹配追踪算法 [38] 等迭代算法中。

$\textbf{ MLE (最大似然估计) 是 MAP (最大后验概率估计) 的一种特殊形式。}$
两者的核心公式对比：MAP (最大后验)：我们想最大化后验概率 $p(\theta | \boldsymbol{Y})$ 。根据贝叶斯公式，去掉分母常数后，目标是： $\hat{\theta}_{\text{MAP}} = \arg \max_{\theta} \left( \underbrace{p(\boldsymbol{Y} | \theta)}_{\text{似然 (Likelihood)}} \cdot \underbrace{p(\theta)}_{\text{先验 (Prior)}} \right)$ MLE (最大似然)：我们要最大化观测数据出现的概率： $\hat{\theta}_{\text{MLE}} = \arg \max_{\theta} \underbrace{p(\boldsymbol{Y} | \theta)}_{\text{似然 (Likelihood)}}$ 连接两者的桥梁：如果你假设先验概率 $p(\theta)$ 是一个常数 (Constant)（即均匀分布， $\theta$ 取任何值的概率都一样）： $p(\theta) = C$ 那么 MAP 的公式就变成了： $\hat{\theta}_{\text{MAP}} = \arg \max_{\theta} \left( p(\boldsymbol{Y} | \theta) \cdot C \right)$ 因为 $C$ 是常数，不影响求最大值的位置，所以它等价于： $\arg \max_{\theta} p(\boldsymbol{Y} | \theta) = \hat{\theta}_{\text{MLE}}$

VI. APPENDIX A DERIVATION OF MAPRT

本附录详细介绍了第 III-A 节中用于单目标检测和位置估计的 MAPRT 的推导。由于远场中的目标是随机存在的，我们可以将目标检测问题表述为二元假设检验问题：

$\begin{aligned} \mathcal{H}_0 &: \boldsymbol{Y} = \boldsymbol{N} \\ \mathcal{H}_1 &: \boldsymbol{Y} = \gamma \boldsymbol{M}(\theta, \tau) + \boldsymbol{N}, \end{aligned} \tag{17}$

其中 $\boldsymbol{M}(\theta, \tau) = \boldsymbol{a}(\theta; \boldsymbol{\kappa})(\boldsymbol{b}(\tau) \odot \boldsymbol{x})^{\top}$ 。

注意，在所考虑的单站设置中，发射通信符号 $\boldsymbol{x}$ 对于感知接收机是已知的。考虑到 $\gamma$ 是一个随机未知量，MAPRT 为

$\mathcal{L}(\boldsymbol{Y}) = \frac{\max_{\gamma, \theta, \tau} p(\gamma, \theta, \tau, \mathcal{H}_1 | \boldsymbol{Y})}{p(\mathcal{H}_0 | \boldsymbol{Y})} \underset{\mathcal{H}_0}{\overset{\mathcal{H}_1}{\gtrless}} \eta. \tag{18}$

将贝叶斯定理应用于 (18) 得到

$\mathcal{L}(\boldsymbol{Y}) = \frac{\max_{\gamma, \theta, \tau} p(\boldsymbol{Y} | \gamma, \theta, \tau, \mathcal{H}_1) p(\gamma) p(\theta) p(\tau) p(\mathcal{H}_1)}{p(\boldsymbol{Y} | \mathcal{H}_0) p(\mathcal{H}_0)} \underset{\mathcal{H}_0}{\overset{\mathcal{H}_1}{\gtrless}} \tilde{\eta}. \tag{19}$

$\frac{P(B|A)P(A)}{P(B)}$

$\mathcal{L}(\boldsymbol{Y}) = \frac{\text{“有目标”这一假设在最合理参数下的最大可能性}}{\text{“纯噪声（没目标）”这一假设的可能性}}$

假设 $p(\mathcal{H}_0) = p(\mathcal{H}_1) = 1/2$ ， $\gamma \sim \mathcal{CN}(0, \sigma_\gamma^2)$ ， $\theta \sim \mathcal{U}([\theta_{\min}, \theta_{\max}])$ ， $\tau \sim \mathcal{U}([\tau_{\min}, \tau_{\max}])$ 并在 (19) 中取对数，我们得到 $^4$

$\mathcal{L}_{\log}(\boldsymbol{Y}) = \frac{\|\boldsymbol{Y}\|_F^2}{N_0} - \min_{\substack{\gamma \\ \theta \in \mathcal{O} \\ \tau \in \mathcal{T}}} \left\{ \frac{\|\boldsymbol{Y} - \gamma \boldsymbol{M}\|_F^2}{N_0} + \frac{|\gamma|^2}{\sigma_\gamma^2} \right\} \underset{\mathcal{H}_0}{\overset{\mathcal{H}_1}{\gtrless}} \bar{\eta}, \tag{20}$

其中 $\mathcal{L}_{\log}(\boldsymbol{Y}) = \log(\mathcal{L}(\boldsymbol{Y}))$ 且 $\bar{\eta} = \tilde{\eta} + \log(\pi \sigma_\gamma^2) + \log(\theta_{\max} - \theta_{\min}) + \log(\tau_{\max} - \tau_{\min})$ 。在 (20) 中给定 $(\theta, \tau)$ 的最佳 $\gamma$ 为

$\hat{\gamma} = \frac{\mathrm{vec}(\boldsymbol{M})^{\mathrm{H}}\mathrm{vec}(\boldsymbol{Y})}{\|\boldsymbol{M}\|_F^2 + N_0/\sigma_\gamma^2}. \tag{21}$

处理 (20) 中的表达式并代入 (21) 得到

$\mathcal{L}_{\log}(\boldsymbol{Y}) = \max_{\substack{\theta \in \mathcal{O} \\ \tau \in \mathcal{T}}} \left\{ \frac{|\mathrm{vec}(\boldsymbol{M})^{\mathrm{H}}\mathrm{vec}(\boldsymbol{Y})|^2}{\|\boldsymbol{M}\|_F^2 + N_0/\sigma_\gamma^2} \right\} \underset{\mathcal{H}_0}{\overset{\mathcal{H}_1}{\gtrless}} \bar{\eta}. \tag{22}$

给定 $\boldsymbol{M}(\theta, \tau)$ 的定义，我们有

$\|\boldsymbol{M}\|_F^2 = N \|\boldsymbol{x}\|_2^2 \tag{23}$

$|\mathrm{vec}(\boldsymbol{M})^{\mathrm{H}}\mathrm{vec}(\boldsymbol{Y})|^2 = |\boldsymbol{a}^{\mathrm{H}}(\theta; \boldsymbol{\kappa})\boldsymbol{Y}(\boldsymbol{b}(\tau) \odot \boldsymbol{x})^*|^2. \tag{24}$

将 (23) 和 (24) 代入 (22) 得到

$\mathcal{L}_{\log}(\boldsymbol{Y}) = \max_{\substack{\theta \in \mathcal{O} \\ \tau \in \mathcal{T}}} \left\{ |\boldsymbol{a}^{\mathrm{H}}(\theta; \boldsymbol{\kappa})\boldsymbol{Y}(\boldsymbol{b}(\tau) \odot \boldsymbol{x})^*|^2 \right\} \underset{\mathcal{H}_0}{\overset{\mathcal{H}_1}{\gtrless}} \eta, \tag{25}$

其中 $\eta = \bar{\eta}(N \|\boldsymbol{x}\|_2^2 + N_0/\sigma_\gamma^2)$ 。一旦我们获得了估计值 $\hat{\theta}, \hat{\tau}$ ，我们可以将估计值代入 (21) 中。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

学长亲荐9个AI论文工具，自考毕业论文轻松搞定！

2048 AI社区

MBA必备8个降AI率工具，高效避坑指南

2048 AI社区

企业级大模型创建与部署全流程（数据集—＞创建模型—＞训练模型—＞评估模型—＞部署模型）

前向传播是数据流动的过程，全连接层和激活函数是构建模型的基础，输出层和任务头决定任务类型，学习率和损失函数驱动训练，反向传播和优化器调整权重，而过拟合是需要避免的陷阱。②、模型架构（任务头+反向传播+）：在预训练模型的基础上，添加任务特定的输出层。①、使用测试集评估模型性能。大模型预训练后，针对不同的下游任务添加的“专用输出层”（后面接不同的任务头来做具体任务，预训练模型通常不包括任务特定的输出层