VAMP由浅入深（Part-2：状态演进分析数学基础）

文章目录向量序列的收敛状态演进分析大系统分析误差函数（Error Function）敏感函数（Sensitivity Function）线性约束下的正交阵Vector Approximate Message Passing, VAMP向量序列的收敛x(N)\boldsymbol x(N)x(N)是一个rNrNrN维的向量，其形式为x(N)=(x1(N),…,xN(N))∈RrN×1(28)\bol

Turbo-shengsong

1249人浏览 · 2022-02-23 21:01:19

Turbo-shengsong · 2022-02-23 21:01:19 发布

Vector Approximate Message Passing, VAMP

向量序列的收敛

$\boldsymbol x(N)$ 是一个 $r N$ 维的向量，其形式为
$\boldsymbol x(N) = (\boldsymbol x_1(N),\ldots,\boldsymbol x_N(N)) \in \mathbb R^{rN \times 1} \tag{28}$
其中的子向量 $\boldsymbol x_n(N) \in \mathbb R^{r}, \forall n$ （ $r$ 可能等于1，表示块向量为标量）。我们称 $\boldsymbol x(N)$ 是一个块向量序列（block vector sequence），该块向量序列含 $N$ 块。这样的向量序列可以是确定的，也可以是随机的。多数情况下，我们会省去符号 $N$ 而简写为 $\boldsymbol x$ 。

$p$ 阶伪Lipschitz函数的定义：给定 $\geq 1$ ， $\boldsymbol f: \mathbb R^s \rightarrow \mathbb R^r$ ，若
$\exist C >0,\text{ such that } {\Vert \boldsymbol f(\boldsymbol x_1) - \boldsymbol f(\boldsymbol x_2) \Vert} \leq C{\Vert \boldsymbol x_1 - \boldsymbol x_2 \Vert} \left[ 1+{\Vert \boldsymbol x_1 \Vert}^{p-1} +{\Vert \boldsymbol x_2 \Vert}^{p-1} \right ] \tag{29}$

则 $\boldsymbol f$ 是 $p$ 阶的伪Lipschitz函数。若 $p = 1$ ，则伪Lipschitz连续就是标准的Lipschitz连续。

现在假设 $\boldsymbol x = \boldsymbol x(N)$ 是一个块序列向量。给定 $\geq 1$ ，如果存在一个随机向量 $\boldsymbol X \in \mathbb R^r$ 满足以下两个条件
（1） $\mathbb E{|\boldsymbol X|}^p < \infty$
（2）对于任意的 $p$ 阶标量伪Lipschitz连续函数，有
$\lim_{N \rightarrow \infty} \frac{1}{N} \sum_{n=1}^N f(x_n(N)) = \mathbb E[f(X)] \text{ a.s..} \tag{30}$
那么我们说 $\boldsymbol x = \boldsymbol x(N)$ 满足 $p$ 阶矩经验收敛，可简写为
$\lim_{N \rightarrow \infty} {\{ x_n \}}_{n=1}^N \overset{PL\left( p \right)}{=} X \tag{31}$
$x_n$ 即是 $x_n(N)$ 的缩略形式。重要的是，条件（2），即式（30）对于标量也成立。

均匀Lipschitz连续的定义：给定函数 $\boldsymbol \phi (\boldsymbol r, \gamma)$ ，如果存在 $L_1, L_2 \geq 0$ ，以及 $\overline{\gamma }$ 的一个邻域 $U$ ，使得

$\Vert \boldsymbol \phi (\boldsymbol r_1, \gamma) - \boldsymbol \phi (\boldsymbol r_2, \gamma) \Vert \leq L_1 \Vert \boldsymbol r_1 - \boldsymbol r_2 \Vert \ \forall \boldsymbol r_1,\boldsymbol r_1 \in \mathbb R^s, \ \gamma \in U \tag{32}$

$\Vert \boldsymbol \phi (\boldsymbol r, \gamma_1) - \boldsymbol \phi (\boldsymbol r, \gamma_2) \Vert \leq L_2(1+\Vert \boldsymbol r \Vert)|\gamma_1 - \gamma_2| \ \forall \boldsymbol r \in \mathbb R^s, \gamma_1,\gamma_2 \in U \tag{33}$

则认为函数 $\boldsymbol \phi (\boldsymbol r, \gamma)$ 在 $\overline{\gamma }$ 满足均匀Lipschitz连续（Uniform Lipschitz Continuous）。

状态演进分析

大系统分析

线性测量模型
重写系统模型为：
$\boldsymbol{y}=\boldsymbol{Ax}^0+\boldsymbol{w}\in \mathbb{R} ^M \ \boldsymbol{w} \sim \mathcal N(\boldsymbol 0, \gamma^{-1}_{\omega 0} \pmb I_N) \tag{34}$
其中 $\boldsymbol A \in \mathbb R^{N\times N}$ （ $\boldsymbol A$ 已知且为方阵【为了便于分析】），高斯噪声 $\boldsymbol w$ 的精度为 $\gamma^{}_{\omega 0}$ （注意： $\gamma^{}_{\omega 0}$ 表示的是真实噪声精度， $\gamma^{}_{\omega }$ 表示的是估计噪声精度）。
关于矩阵 $\boldsymbol A$ 的假设：我们假设矩阵 $\boldsymbol A$ 是一个大的右旋转不变（Right-orthogonally invariant）矩阵，它的奇异值分解为
$\boldsymbol A = \boldsymbol U \boldsymbol S \boldsymbol V^T, \ \boldsymbol S = \text{Diag}(\boldsymbol s) \tag{35}$

其中， $\boldsymbol U, \boldsymbol V \in \mathbb R^{N \times N}$ 是酉阵，并且 $\boldsymbol U$ 是确定的， $\boldsymbol V$ 服从Haar分布（在正交阵集合中服从均匀分布）。

右旋转不变的解释：
$p(\boldsymbol A) = p(\boldsymbol {AV}_0) \ \text{for any fixed orthogonal matrix } \boldsymbol V_0 \tag{36}$

如何理解长方矩阵 $\boldsymbol A$ ：
$\boldsymbol{A}=\boldsymbol{USV}^T=\left[ \begin{matrix} \boldsymbol{U}_{\boldsymbol{0}}& \boldsymbol{0}\\ \boldsymbol{0}& \boldsymbol{I}\\ \end{matrix} \right] \mathrm{Diag}\left( \left[ \begin{array}{c} \boldsymbol{s}_0\\ \boldsymbol{0}\\ \end{array} \right] \right) \boldsymbol{V}^T=\boldsymbol{U}_{\boldsymbol{0}}\boldsymbol{S}_0\boldsymbol{V}^T \tag{37}$

滤波（去噪）
在分析当中，我们认为滤波函数 $\pmb {\mathrm{g}}_1 (\cdot,\gamma_{1k})$ 是一般的，不针对特定的准则，假设元素可分 ${\mathrm{g}}_1 (\cdot,\gamma_{1k})$ ，并且 ${\mathrm{g}}_1 (\cdot,\gamma_{1k})$ 满足特定的Lipschitz连续条件。
逼近分布
对于式（34）给出的模型，噪声分布已知，对矩阵 $\boldsymbol A$ 的奇异值分解形式（37），我们已知矩阵 $\boldsymbol U$ 是确定的，矩阵 $\boldsymbol V$ 服从Haar分布，现在只剩真实向量 $\boldsymbol x^0$ 和奇异值向量 $\boldsymbol s$ 的分布未知。这里不去深究个中原因，直接给出以下结论：
（1）我们假设奇异值向量 $\boldsymbol s \in \mathbb R^N$ 的元素，以二阶矩经验收敛于随机变量 $S$ ，结合式（31），得到
$\lim_{N \rightarrow \infty} {\{ s_n \}}_{n=1}^N \overset{PL\left( 2 \right)}{=} S \tag{38}$

并假设 $\mathbb E[S] > 0$ 且 $\in [0,S_\text{max}]$ 。
（2）我们假设滤波器的初始输入 $\boldsymbol r_{10}$ 和真实信号 $\boldsymbol x^{0}$ 经验收敛如下：
$\lim_{N \rightarrow \infty} {\{ r_{10,n},x^0_{n} \}}_{n=1}^N \overset{PL\left( 2 \right)}{=} (R_{10},X^0) \tag{39}$

我们考虑式（9）给出的MMSE滤波器，在考虑 $\boldsymbol x^0$ 的逼近分布下，即式（39），MMSE滤波器 $\mathrm g_1(r_1,\gamma_1)$ 及其一阶导可以表示为：
$\mathrm g_1(r_1,\gamma_1) = \mathbb E \left[ X^0| R_1=r_1\right] \\ \mathrm g^{\prime}_1(r_1,\gamma_1) = \gamma_1 \text{var} \left[ X^0| R_1=r_1\right] \\ R_1 = X^0 + P, \ P \sim \mathcal N(0,\gamma^{-1}_1) \tag{40}$

因此,MMSE滤波器及其一阶导可以通过计算后验分布 $p(X^0|R_1 = r_1)$ 的均值和方差得到。

误差函数（Error Function）

（1）对从测量值 $R$ 的估计 $\hat {X} = \mathrm{g_1}(R_1, \gamma_1)$ 的MSE $\mathcal E_1(\gamma_1, \tau_1)$ ：
$\mathcal E_1(\gamma_1, \tau_1) \coloneqq \mathbb E \left[ {(\mathrm g_1 (R_1, \gamma_1) - X^0)}^2\right] \\ R_1 = X^0 + P, \ P \sim \mathcal N(0, \tau_1) \tag{41}$
（2）LMMSE估计器（回忆式（23））的误差函数：
$\mathcal E_2(\gamma_2, \tau_2) \coloneqq \lim_{N \rightarrow \infty} \frac{1}{N} \mathbb E \left[ {\Vert \pmb {\mathrm g}_2(\boldsymbol r_2, \gamma_2 )- \boldsymbol x^0 \Vert}^2\right], \\ \boldsymbol r_2 = \boldsymbol x^0 + \boldsymbol q, \ \boldsymbol q \sim \mathcal N(0, \tau_2 \pmb I) \\ \boldsymbol y = \boldsymbol{Ax}^0+\boldsymbol w, \boldsymbol w \sim \mathcal N(0, \gamma^{-1}_{\omega 0}) \tag{42}$
当 $\tau_1=\gamma^{-1}_1,\tau_2=\gamma^{-1}_2,\gamma_\omega = \gamma_{\omega 0}$ 时，我们认为两个估计器 $\pmb {\mathrm g}_1$ 和 $\pmb {\mathrm g}_2$ 都是“匹配的”，在该匹配条件下，使用更加简略的符号：
$\mathcal E_1(\gamma_1) \coloneqq \mathcal E_1(\gamma^{}_1,\gamma^{-1}_1), \ \mathcal E_2(\gamma_2) \coloneqq \mathcal E_2(\gamma^{}_2,\gamma^{-1}_2) \tag{43}$

引理1：对以上两个误差函数 $\mathcal E_1, \mathcal E_2$
（a）对式（40）所描述的MMSE滤波器，在“匹配”条件下，即 $\tau_1 = \gamma^{-1}_1$ 时，误差函数就是条件方差，即，
$\mathcal E_1(\gamma_1) = \text{var} \left[ X^0|R_1=X^0+P\right], \ P \sim \mathcal N(0,\gamma^{-1}_1) \tag{44}$

（直接由式（40）得到）
（b）LMMSE误差函数可以被表示为：
$\mathcal E_2 (\gamma_2, \tau_2) = \lim_{ N \rightarrow \infty} \frac{1}{N}\text{tr}\left[ \boldsymbol Q^{-2} \tilde {\boldsymbol Q}\right] \tag{45}$

其中，
$\boldsymbol Q \coloneqq \gamma_{\omega} \boldsymbol A^T \boldsymbol A + \gamma_2 \pmb I, \ \tilde {\boldsymbol Q} \coloneqq \frac{\gamma^2_{\omega}}{\gamma_{\omega 0}} \boldsymbol A^T \boldsymbol A + \tau_2 \gamma^2_2 \pmb I \tag{46}$

当满足匹配条件 $\tau_2 = \gamma^{-1}_2$ ， $\gamma_\omega = \gamma_{\omega 0}$ 时，
$\mathcal E_2(\gamma_2) = \lim_{N \rightarrow \infty} \frac{1}{N} \text{tr}\left [ \boldsymbol Q^{-1} \right ] \tag{47}$

证明（b）：已知 $\boldsymbol{y}=\boldsymbol{Ax}^0+\boldsymbol{w}$ ， $\boldsymbol r_2 = \boldsymbol x^0 + \boldsymbol q$
LMMSE估计的误差：
$\begin{aligned} \pmb {\mathrm{g}}_2(\boldsymbol r_2, \gamma_2) - \boldsymbol x^0 &= {\left( \gamma_\omega \boldsymbol A^T \boldsymbol A + \gamma_{2k} \pmb I \right)}^{-1} \left( \gamma_\omega \boldsymbol A^T (\boldsymbol {Ax}^0+\boldsymbol {\omega}) + \gamma_{2}\boldsymbol r_{2} \right) - \boldsymbol x^0 \\ &={\left( \gamma_\omega \boldsymbol A^T \boldsymbol A + \gamma_{2k} \pmb I \right)}^{-1} \left( \gamma_2 \boldsymbol q + \gamma_{\omega} \boldsymbol A^T \boldsymbol w \right) \\ &= \boldsymbol Q^{-1} \left( \gamma_2 \boldsymbol q + \gamma_{\omega} \boldsymbol A^T \boldsymbol w \right) \end{aligned} \tag{48}$

$\pmb {\mathrm{g}}_2(\boldsymbol r_2, \gamma_2) - \boldsymbol x^0$ 的协方差矩阵为：
$\begin{aligned} & \mathbb E \left [ { (\pmb {\mathrm{g}}_2(\boldsymbol r_2, \gamma_2) - \boldsymbol x^0)(\pmb {\mathrm{g}}_2(\boldsymbol r_2, \gamma_2) - \boldsymbol x^0)^T }\right ] \\ &=\boldsymbol Q^{-1} \left [ \gamma^2_2 \mathbb E [\boldsymbol q \boldsymbol q^T] + \gamma^2_{\omega} \boldsymbol A \mathbb E[\boldsymbol {ww}^T] \boldsymbol A^T \right ] \boldsymbol Q^{-1} \\ &= \boldsymbol Q^{-1} \tilde {\boldsymbol Q} \boldsymbol Q^{-1} \end{aligned} \tag{49}$

将式（49）求迹代入到式（42）即可得到式（47）
证毕！
（c）LMMSE误差函数也可以被表示为（将 $\boldsymbol A$ 的奇异值分解代入到（b）中 i）：
$\mathcal E_2(\gamma_2, \tau_2) = \mathbb E \left[ \frac{\gamma^2_{\omega} S^2/\gamma_{\omega 0} + \tau_2 \gamma^2_2}{(\gamma_{\omega} S^2 + \gamma_2)^2} \right] \tag{50}$
其中 $S$ 是一个A的奇异值所构成的随机变量（如式（38）），对于“匹配”条件： $\tau_2 = \gamma^{-1}_2$ ， $\gamma_\omega = \gamma_{\omega 0}$ ，有
$\mathcal E_2(\gamma_2) = \mathbb E \left[ \frac{1}{\gamma_\omega S^2 + \gamma_2}\right ] \tag{51}$

敏感函数（Sensitivity Function）

敏感函数描述的是估计器（滤波器）的期望散度。
（1）对于滤波器 $\pmb {\mathrm g_1}$ ，其敏感函数定义为：
$A_1(\gamma_1, \tau_1) \coloneqq \mathbb E[\mathrm {g^{\prime}_1(R_1, \gamma_1)}], \\ R_1 = X^0 + P, \ P \sim \mathcal N(0, \tau_1) \tag{52}$
（2）对于LMMSE估计器，其敏感函数定义为：
$A_2(\gamma_2) \coloneqq \lim_{N \rightarrow \infty} \frac{1}{N} \text{tr} \left [ \frac{\partial \pmb {\mathrm g_2(\boldsymbol r_2, \gamma_2)}}{\partial \boldsymbol r_2} \right ] \tag{53}$

引理2：对于上述敏感函数：
（a） “匹配”条件下 $\tau_1 = \gamma^{-1}_1$ ，的MMSE滤波器，敏感函数为
$A_1(\gamma_1, \gamma^{-1}_1) = \gamma_1 \text{var} \left [ X^0|R_1 = X^0+\mathcal N(0,\gamma^{-1}_1) \right ] \tag{54}$
（2）LMMSE估计器的敏感函数
$A_2(\gamma_2 ) = \lim_{N \rightarrow \infty} \frac{1}{N} \gamma_2 \text{tr} \{ \boldsymbol Q^{-1} \} \tag{55}$
（c）LMMSE估计器的敏感函数也可写作：
$A_2(\gamma_2) = \mathbb E \left[ \frac{\gamma_2}{ \gamma_{\omega}S^2 + \gamma_2} \right ] \tag{56}$

线性约束下的正交阵

（服务于理论1的证明）
假设 $\boldsymbol V \in \mathbb R^{N \times N}$ 是正交阵，且满足线性约束
$\boldsymbol A = \boldsymbol {VB} \tag{57}$
其中 $\boldsymbol A, \boldsymbol B \in \mathbb R^{N \times s}$ ，假设矩阵 $\boldsymbol A, \boldsymbol B$ 列满秩，因此 $\leq N$ 。让
$\boldsymbol {U_A}=\boldsymbol A (\boldsymbol A^T \boldsymbol A)^{-1/2}, \ \boldsymbol {U_B}=\boldsymbol B (\boldsymbol B^T \boldsymbol B)^{-1/2} \tag{67}$
我们记矩阵 $\boldsymbol A$ 的SVD分解形式为 $\boldsymbol A = \boldsymbol {E_A} \boldsymbol {\Sigma_A} \boldsymbol {F^T_A}$ ，矩阵 $\boldsymbol B$ 类似，为 $\boldsymbol B = \boldsymbol {E_B} \boldsymbol {\Sigma_B} \boldsymbol {F^T_B}$ ，其中 $\boldsymbol {E_A}, \boldsymbol {E_B} \in \mathbb R^{N \times s}$ ，则
$\boldsymbol {U_A}= \boldsymbol {E_A} \boldsymbol {F^T_A}, \ \boldsymbol {U_B}= \boldsymbol {E_B} \boldsymbol {F^T_B} \tag{68}$
令 $\boldsymbol U_{\boldsymbol A^{\bot}} \in \mathbb R^{N \times (N-s)}$ 表征 $\text{range}(\boldsymbol A)^{\bot}$ 的正交基底所构成的矩阵（列向量正交），令 $\boldsymbol U_{\boldsymbol B^{\bot}} \in \mathbb R^{N \times (N-s)}$ 表征 $\text{range}(\boldsymbol B)^{\bot}$ 的正交基底所构成的矩阵（列向量正交）。注意到
$\text{range}(\boldsymbol A)^{\bot}=\text{ker} \boldsymbol A^T \tag{69}$
而 $\boldsymbol A^T$ 的SVD分解为 $\boldsymbol A^T=\boldsymbol F_{\boldsymbol A} \boldsymbol {\Sigma_A} \boldsymbol {E}^T_{\boldsymbol A}$ ，假设 $[\boldsymbol E_{\boldsymbol A}, \boldsymbol E^{\bot}_{\boldsymbol A}] \in R^{N \times N}$ 构成一个正交阵，其中 $\boldsymbol E^{\bot}_{\boldsymbol A}$ 表征 $\text{range}(\boldsymbol E_{\boldsymbol A})^{\bot}$ 。所以有，
$\text{ker} \boldsymbol A^T=\text{range} \boldsymbol (E_{\boldsymbol A})^{\bot}=\text{ker} \boldsymbol E^T_{\boldsymbol A} \\ (\text{range} \boldsymbol A)^{\bot}=\text{ker} \boldsymbol (E^T_{\boldsymbol A})^{}=(\text{range} \boldsymbol E_{\boldsymbol A} )^{\bot}\tag{70}$
同理， $\boldsymbol B$ 也有类似的结论，这里不做赘述。因此，可令
$\boldsymbol U_{\boldsymbol A^{\bot}} = \boldsymbol E^{\bot}_{\boldsymbol A}, \ \boldsymbol U_{\boldsymbol B^{\bot}} = \boldsymbol E^{\bot}_{\boldsymbol B} \tag{71}$
此外，定义
$\tilde {\boldsymbol V} \coloneqq \boldsymbol U^T_{\boldsymbol A^{\bot}} \boldsymbol V \boldsymbol U_{\boldsymbol B^{\bot}} \in \mathbb R^{(N-s) \times (N-s)} \tag{72}$

引理3：在上述定义下，有如下关系式
$\boldsymbol V = \boldsymbol A (\boldsymbol A^T \boldsymbol A)^{-1} \boldsymbol B^T + \boldsymbol U_{\boldsymbol A^{\bot}} \tilde {\boldsymbol V} \boldsymbol U^T_{\boldsymbol B^{\bot}} \tag{73}$
证明：令 $\boldsymbol P_{\boldsymbol A} \coloneqq \boldsymbol {U_A} \boldsymbol U^T_{\boldsymbol A}=\boldsymbol {E_A} \boldsymbol E^T_{\boldsymbol A}$ ， $\boldsymbol P^{\bot}_{\boldsymbol A} \coloneqq \boldsymbol U_{\boldsymbol A^{\bot}} \boldsymbol U^T_{\boldsymbol A^{\bot}}=\boldsymbol E^{\bot}_{\boldsymbol A} (\boldsymbol E^{\bot}_{\boldsymbol A})^T$ ，类似地定义 $\boldsymbol P_{\boldsymbol B}$ 和 $\boldsymbol P^{\bot}_{\boldsymbol B}$ ，则
$(\boldsymbol P_{\boldsymbol A} +\boldsymbol P^{\bot}_{\boldsymbol A})=\sum_{i} \left( \boldsymbol u_{\boldsymbol A,i} \boldsymbol u^T_{\boldsymbol A,i} + \boldsymbol u^{\bot}_{\boldsymbol A,i} (\boldsymbol u^{\bot}_{\boldsymbol A,i})^T \right )=[\boldsymbol E_{\boldsymbol A}, \boldsymbol E^{\bot}_{\boldsymbol A}] \cdot [\boldsymbol E_{\boldsymbol A}, \boldsymbol E^{\bot}_{\boldsymbol A}]^T = \pmb I_N \tag{74}$

又因为式（57） $\boldsymbol A = \boldsymbol {VB}$ ，
$\begin{aligned} & P_{\boldsymbol B} \text{ are the projections onto } \text{range} {\boldsymbol B} \\ & \Longrightarrow \forall \boldsymbol x \in \mathbb R^{N}, \ \exist \boldsymbol y \in \mathbb R^{N} \text{ such that } \boldsymbol P_{\boldsymbol B} \boldsymbol x = \boldsymbol B \boldsymbol y \\ & \Longrightarrow \boldsymbol V \boldsymbol P_{\boldsymbol B} \boldsymbol x = \boldsymbol V \boldsymbol B \boldsymbol y=\boldsymbol A \boldsymbol y; \\ & \text{range}(\boldsymbol P^{\bot}_{\boldsymbol A})=\text{range}(\boldsymbol A^{\bot}) \bot \text{range}(\boldsymbol A) \\ & \Longrightarrow \boldsymbol P^{\bot}_{\boldsymbol A} \boldsymbol A \boldsymbol y= \boldsymbol P^{\bot}_{\boldsymbol A} \boldsymbol V \boldsymbol P_{\boldsymbol B} \boldsymbol x= \boldsymbol 0 \\ & \Longrightarrow \boldsymbol P^{\bot}_{\boldsymbol A} \boldsymbol V \boldsymbol P_{\boldsymbol B}= \boldsymbol 0 \end{aligned}$

类似地， $\boldsymbol A = \boldsymbol {VB} \Longrightarrow \boldsymbol B=\boldsymbol V^T \boldsymbol A$ ，同理可得 $\boldsymbol P^{\bot}_{\boldsymbol B} \boldsymbol V^T \boldsymbol P_{\boldsymbol A}= \boldsymbol 0 \Longrightarrow \boldsymbol P^{}_{\boldsymbol A} \boldsymbol V \boldsymbol P^{\bot}_{\boldsymbol B}= \boldsymbol 0$
$\begin{cases} \boldsymbol P^{\bot}_{\boldsymbol A} \boldsymbol V \boldsymbol P_{\boldsymbol B}= \boldsymbol 0 \\ \boldsymbol P^{}_{\boldsymbol A} \boldsymbol V \boldsymbol P^{\bot}_{\boldsymbol B}= \boldsymbol 0 \\ \end{cases} \tag{75}$

因此
$\begin{aligned} \boldsymbol V &= (\boldsymbol P_{\boldsymbol A} +\boldsymbol P^{\bot}_{\boldsymbol A}) \boldsymbol V (\boldsymbol P_{\boldsymbol B} +\boldsymbol P^{\bot}_{\boldsymbol B}) \\ &= \boldsymbol P^{}_{\boldsymbol A} \boldsymbol V \boldsymbol P^{}_{\boldsymbol B}+\boldsymbol P^{\bot}_{\boldsymbol A} \boldsymbol V \boldsymbol P^{\bot}_{\boldsymbol B} \end{aligned} \tag{76}$

式（76）的第一项：
$\begin{aligned} \boldsymbol P^{}_{\boldsymbol A} \boldsymbol V \boldsymbol P^{}_{\boldsymbol B}&=\boldsymbol P^{}_{\boldsymbol A} \boldsymbol V \boldsymbol B (\boldsymbol B^T \boldsymbol B)^{-1} \boldsymbol B^T \\ &=\boldsymbol P^{}_{\boldsymbol A} \boldsymbol A (\boldsymbol B^T \boldsymbol B)^{-1} \boldsymbol B^T \\ &=\boldsymbol {E_A} \boldsymbol E^T_{\boldsymbol A} \boldsymbol {E_A} \boldsymbol {\Sigma_A} \boldsymbol {F^T_A} (\boldsymbol B^T \boldsymbol B)^{-1} \boldsymbol B^T \\ &= \boldsymbol {E_A} \boldsymbol {\Sigma_A} \boldsymbol {F^T_A} (\boldsymbol B^T \boldsymbol B)^{-1} \boldsymbol B^T \\ &= \boldsymbol A (\boldsymbol B^T \boldsymbol B)^{-1} \boldsymbol B^T \\ &= \boldsymbol A (\boldsymbol A^T \boldsymbol A)^{-1} \boldsymbol B^T (\Longleftarrow \boldsymbol A^T \boldsymbol A=\boldsymbol B^T \boldsymbol V^T \boldsymbol V \boldsymbol B=\boldsymbol B^T \boldsymbol B) \tag{77} \end{aligned}$

第二项：
$\boldsymbol P^{\bot}_{\boldsymbol A} \boldsymbol V \boldsymbol P^{\bot}_{\boldsymbol B}=\boldsymbol U_{\boldsymbol A^{\bot}} \tilde {\boldsymbol V} \boldsymbol U^T_{\boldsymbol B^{\bot}} \tag{78}$

另外，可以得到矩阵 $\tilde {\boldsymbol V} = \boldsymbol U^T_{\boldsymbol A^{\bot}} \boldsymbol V \boldsymbol U_{\boldsymbol B^{\bot}} \in \mathbb R^{(N-s) \times (N-s)}$ 是正交阵，如下所述：
$\begin{aligned} {\tilde {\boldsymbol V}}^T \tilde {\boldsymbol V}&=\boldsymbol U^T_{\boldsymbol B^{\bot}} \boldsymbol V^T \boldsymbol P^{\bot}_{\boldsymbol A} \boldsymbol V \boldsymbol U_{\boldsymbol B^{\bot}} \\ &= \boldsymbol U^T_{\boldsymbol B^{\bot}} \boldsymbol V^T (\pmb I - \boldsymbol P^{}_{\boldsymbol A}) \boldsymbol V \boldsymbol U_{\boldsymbol B^{\bot}} \\ &= \boldsymbol U^T_{\boldsymbol B^{\bot}} \boldsymbol V^T \pmb I \boldsymbol V \boldsymbol U_{\boldsymbol B^{\bot}} - \boldsymbol U^T_{\boldsymbol B^{\bot}} \boldsymbol V^T \boldsymbol P^{}_{\boldsymbol A} \boldsymbol V \boldsymbol U_{\boldsymbol B^{\bot}} \\ &= \pmb I - \boldsymbol U^T_{\boldsymbol B^{\bot}} \boldsymbol V^T \boldsymbol P^{}_{\boldsymbol A} \boldsymbol V \boldsymbol U_{\boldsymbol B^{\bot}} \end{aligned} \tag{79}$

要证 $\tilde {\boldsymbol V}$ 为正交阵，只需证：
$\boldsymbol U^T_{\boldsymbol B^{\bot}} \boldsymbol V^T \boldsymbol P^{}_{\boldsymbol A} \boldsymbol V \boldsymbol U_{\boldsymbol B^{\bot}} = \pmb 0 \tag{80}$
因为 $\text{ range}(\boldsymbol B^{\bot})^{\bot}=\text{ker}{\boldsymbol (B^{\bot}})^T$ ，即 $\text{ range}(\boldsymbol B)=\text{ker}{\boldsymbol (B^{\bot}})^T$
所以只需证
$\text{range}(\boldsymbol B)=\text{range}(\boldsymbol V^T \boldsymbol {P_A}) \tag{81}$
因为 $\text{range}(A)=\text{range}( \boldsymbol {P_A})$ ，且 $\boldsymbol B=\boldsymbol V^T \boldsymbol A$ ，
$\text{range}(\boldsymbol B)=\text{range}(\boldsymbol V^T \boldsymbol A) \overset{?}{=} \text{range}(\boldsymbol V^T \boldsymbol {P_A}) \\ \text{?的充分必要性证明：} \\ \subseteq : \forall \boldsymbol x, \exist \boldsymbol y, \text{such that} \boldsymbol {Ax} = \boldsymbol {P_A y} \\ \supseteq : \forall \boldsymbol y, \exist \boldsymbol x, \text{such that} \boldsymbol {P_A y} = \boldsymbol {Ax}$

因此式（81）成立，因此式（80）成立，因此式（79）成立， $\tilde {\boldsymbol V}$ 为正交阵。

引理4：让 $\boldsymbol V \in \mathbb R^{N \times N}$ 满足Haar分布。假设上面所定义的矩阵 $\boldsymbol A, \boldsymbol B$ 是确定的， $G$ 代表事件：矩阵 $\boldsymbol V$ 满足约束条件 $\boldsymbol A = \boldsymbol {VB}$ ，即式（57）。则给定事件 $G$ 下， $\tilde {\boldsymbol V}$ 服从Haar分布且独立于 $G$ 。
证明：令 $O_N$ 表示 $\times N$ 的正交阵的集合，令 $\mathcal L=\{ \boldsymbol V \in O_N \text{ and } \boldsymbol A = \boldsymbol {VB}\}$ 。不考虑约束条件（57），若 $p_{\boldsymbol V}(\boldsymbol V)$ 为在 $O_N$ 上的均匀概率密度函数（Haar），那么给定事件 $G$ 下， $\boldsymbol V$ 的条件概率密度函数为：
$p_{\boldsymbol V|G}(\boldsymbol V|G)=\frac{1}{Z}p_{\boldsymbol V}(\boldsymbol V) \mathbb I_{\{ \boldsymbol V \in \mathcal L\}} \tag{82}$
其中 $\mathbb I(\cdot)$ 表示指示函数， $Z$ 是归一化因子。
结合式（72）和式（73），可以得到
$p_{\tilde {\boldsymbol V}|G}(\tilde {\boldsymbol V}|G) \propto p_{\boldsymbol V| G}(\phi(\tilde {\boldsymbol V})|G) \propto p_{\boldsymbol V}(\phi( \tilde {\boldsymbol V})) \mathbb I_{\{ \phi( \tilde {\boldsymbol V}) \in \mathcal L\}}=p_{\boldsymbol V}(\phi( \tilde {\boldsymbol V})) \tag{83}$

式（83）最后一步是因为 $\phi( \tilde {\boldsymbol V}) \in \mathcal L$ 意味着约束条件（式（57））已经满足，所以去掉了指示函数。
令 $\phi: \tilde {\boldsymbol V} \rightarrow \boldsymbol V$ 表示从 $O_{N-s}$ 到 $\mathcal L$ 的映射（该映射可逆）。要证明 $\tilde {\boldsymbol V}$ 条件服从Haar分布，只需证
$p_{\tilde {\boldsymbol V}|G}(\boldsymbol W_0\tilde {\boldsymbol V}|G)= p_{\tilde {\boldsymbol V}|G}(\tilde {\boldsymbol V}|G) \ \text{for any } \boldsymbol W_0 \in O_{N-s} \tag{84}$
要证式（83），首先定义矩阵
$\boldsymbol W = \boldsymbol U_{\boldsymbol A} \boldsymbol U^T_{\boldsymbol A} + \boldsymbol U_{\boldsymbol A^{\bot}} \boldsymbol W_0 \boldsymbol U^T_{\boldsymbol A^{\bot}} \tag{85}$

可以证明 $\boldsymbol W$ 为正交阵（通过计算 $\boldsymbol W^T \boldsymbol W=\pmb I$ ，过程中有一个步骤需要类比式（74）），且可以验证：
$\phi(\boldsymbol W_0 \tilde {\boldsymbol V})=\boldsymbol W \phi(\tilde {\boldsymbol V}) \tag{86}$

(将式（67）代入式（84）)。因此
$p_{\tilde {\boldsymbol V}|G}(\boldsymbol W_0\tilde {\boldsymbol V}|G) \overset{a} {\propto}p_{\boldsymbol V}\left(\phi (\boldsymbol W_0 \tilde {\boldsymbol V})\right) \overset{b}{\propto}p_{\boldsymbol V}\left(\boldsymbol W \phi(\tilde {\boldsymbol V})\right) \overset{c}{\propto} p_{\boldsymbol V}\left(\phi (\tilde {\boldsymbol V})\right) \tag{87}$

其中(a)由式（83）可得，（b）由式（86）可得，（c）是因为 $\boldsymbol V$ 的正交不变性（参考式（36））。
因此，
$\begin{cases} \text{eq.(83)} \Longrightarrow p_{\tilde {\boldsymbol V}|G}(\tilde {\boldsymbol V}|G) \propto p_{\boldsymbol V}(\phi( \tilde {\boldsymbol V})) \\ \text{eq.(87)} \Longrightarrow p_{\tilde {\boldsymbol V}|G}(\boldsymbol W_0\tilde {\boldsymbol V}|G) \propto p_{\boldsymbol V}\left(\phi (\tilde {\boldsymbol V})\right) \\ \end{cases} \tag{88}$

因此式（84）成立，因此 $\tilde {\boldsymbol V}$ 服从Haar分布。

引理5：给定维度 $\geq 0$ ，若 $\boldsymbol x(N)$ 和 $\boldsymbol U(N)$ 是序列向量和序列矩阵（关于 $N$ ），那么，对任意 $N$ ，给定以下三个条件：
（1） $\boldsymbol U = \boldsymbol U(N) \in \mathbb R^{N \times (N-s)}$ 是一个确定的矩阵，且 $\boldsymbol U^T \boldsymbol U= \pmb I$ ；
（2） $\boldsymbol x = \boldsymbol x(N) \in \mathbb R^{ (N-s)}$ 是一个随机向量，且分布满足各向同性（isotropically distributed）。
（3） $\lim_{N \rightarrow \infty} \frac{1}{N} {\Vert \boldsymbol x \Vert}^2 = \tau$
那么，若定义 $\boldsymbol y = \boldsymbol {Ux}$ ，则 $\boldsymbol y$ 的每一个元素经验收敛于（Converge empirically）一个高斯随机变量，即
$\lim_{N \rightarrow \infty} \{ y_n \}\overset{PL(2)}{=}Y \sim \mathcal N(0, \tau) \tag{89}$

证明：因为 $\boldsymbol x$ 的分布各向同性，则我们可以用一个归一化的高斯随机变量来表征，即
$\boldsymbol x \overset{d}{=} \frac{\Vert \boldsymbol x \Vert}{\Vert \boldsymbol w_0 \Vert} \boldsymbol w_0, \ \boldsymbol w_0 \sim \mathcal N(\boldsymbol 0, \pmb I_{N-s})$

对任意 $N$ ，构建正交阵 $\boldsymbol S=[\boldsymbol U \ \boldsymbol U_{\bot}]$ 。令 $\boldsymbol w_1 \sim \mathcal N(\boldsymbol 0, \pmb I_s)$ ，独立于 $\boldsymbol w_0$ ，定义
$\boldsymbol{w}=\left[ \begin{array}{c} \boldsymbol{w}_0\\ \boldsymbol{w}_1\\ \end{array} \right] \sim \mathcal N(\boldsymbol 0, \boldsymbol I_N)$
根据定义，写出 $\boldsymbol y$ :
$\boldsymbol y = \boldsymbol {Ux} \overset{d}{=} \frac{\Vert \boldsymbol x \Vert}{\Vert \boldsymbol w_0 \Vert} [\boldsymbol S \boldsymbol w - \boldsymbol U_{\bot} \boldsymbol w_1] \tag{90}$

不难得到
$\lim_{N \rightarrow \infty} \frac{\Vert \boldsymbol x \Vert}{\Vert \boldsymbol w_0 \Vert} = \lim_{N \rightarrow \infty} \frac{\Vert \boldsymbol x \Vert}{\sqrt {(N-s)}} = \sqrt \tau$

$\lim_{N \rightarrow \infty} \frac{1}{N-s}{\Vert \boldsymbol U_{\bot} \boldsymbol w_1 \Vert}^2 = \lim_{N \rightarrow \infty} \frac{1}{N} {\Vert \boldsymbol w_1 \Vert}^2=0$