Coarray Tensor Train Decomposition for Bistatic MIMO Radar With Uniform Planar Array (I)
摘要——近年来,张量网络分解因其在建模高阶张量多维相关性方面的高效性而引起了越来越多的关注。考虑到这一优势,本研究采用张量列分解(Tensor Train Decomposition, TTD)来实现具有均匀平面阵列(UPA)配置的双基地多输入多输出(MIMO)雷达系统中的联合二维发射角(2-D-DOD)和二维到达角(2-D-DOA)估计。
-
首先,定义了一个 5-D 张量,以整合来自发射 UPA (TUPA) 和接收 UPA (RUPA) 的 2-D 空间信息,并将其与时间信息相结合。接下来,通过沿 5-D 张量的时间维度执行自相关运算,生成一个低秩 4-D 张量,从而形成一个封装了 TUPA 和 RUPA 的差分共阵(difference coarrays)的结构。
-
然后,设计了一个 TTD 框架,将该 4-D 张量分解为相互连接的低阶 TT-核(TT-cores)。此外,在 TT-核与原始范德蒙(Vandermonde)因子矩阵之间建立了精确的双向映射。
-
最后,利用 TT-核的不同组合,开发了两种创新方法来恢复范德蒙因子矩阵。所提出的方法通过在所有因子矩阵中强制执行一致的置换顺序(permutation orders),实现了 2-D-DOD 和 2-D-DOA 估计的自动配对。仿真实验验证了所提出的方法。结果表明,所提出的方法在估计精度方面优于现有的基于张量的方法。
关键词——二维发射角(2-D-DOD)和二维到达角(2-D-DOA)估计,双基地均匀平面阵列(UPA)多输入多输出(MIMO)雷达,高阶张量,张量列分解(TTD),范德蒙矩阵。
I. INTRODUCTION
在双基地 MIMO 雷达系统中,张量作为一种自然的框架用于建模接收数据,因为它们具有保留高维数据结构的固有能力。即,作为多维数组,张量保留了高维数据中内在的多线性关系,从而能够获得更准确的表示 [17, 18, 19]。
- 例如,文献 [20] 提出了塔克分解 (TD) 以提高 MC(互耦)场景下的参数估计精度。
- 此外,文献 [21] 开发了基于 CANDECOMP/PARAFAC 分解 (CPD) 的两步法 MC 自校准方法。
- 此外,为了解决空间色噪声问题,引入了先进的 CPD 变体,包括标准 CPD [22]、贝叶斯 CPD [23] 和范德蒙约束 CPD [24]。
- 文献 [25] 还提出了一种改进的 CPD 变体,用于校正多时隙幅相误差。
这些变体在温和条件下表现出鲁棒的唯一性保证,并已成功应用于各种双基地 MIMO 雷达配置,包括具有失效阵元的系统 [26]、嵌套阵列 [27]、互质阵列 [28] 以及 EMVS-MIMO 雷达设置 [29], [30], [31]。它们的主要优势在于直接从张量因子中估计 DOD 和 DOA,从而简化了估计过程。
前面的分析表明,TD 和 CPD 技术代表了显著的张量分解方法,并且它们已被广泛应用于 DOD 和 DOA 估计中。然而,随着张量维度的增加,这些方法始终面临着与维数灾难相关的挑战。为了解决这一局限性,最近的研究提出了先进的张量网络分解技术(advanced tensor network decomposition techniques),包括张量列分解 (tensor train decomposition,TTD) 技术 [32] 和张量环分解技术(tensor ring decomposition technique) [33]。
与 TD 和 CPD 技术相比,TTD 和 TRD 技术通过灵活的核间连接性,增强了捕捉高维相关性的能力。这些分解框架在许多应用中表现出了良好的性能,例如张量补全 [34], [35], [36]、高光谱成像 (HSI) [37], [38], [39] 以及基于深度学习的应用 [40], [41], [42]。尽管如此,这些框架的现有实现往往省略了核因子的后处理并直接输出它们,这使得它们不太适用于双基地 MIMO 雷达系统。最近的创新方法,如
-
联合降维和因子恢复方法 [43], [44], [45],通过将迭代过程(例如,三重交替最小二乘法 (ALSs) 和双重 ALS)集成到 MIMO 信道估计中来解决这一缺点。
-
进一步的进展包括基于旋转不变性的 TTD [46], [47] 和 TRD [48] 方法,这些方法利用了范德蒙结构特性。
-
此外,有人提出了亚奈奎斯特 TTD [49] 用于立方体稀疏阵列中的 DOA 估计。
-
此外,文献 [50] 确定了 TT-核与因子矩阵之间的精确映射关系,从而能够通过对 TT-核进行三阶 CPD 运算来恢复因子。
受先前工作的启发,本研究采用 TTD 来估计具有均匀平面阵列 (UPA) 配置的双基地 MIMO 雷达系统中的 2D-DOD 和 2D-DOA。此外,开发了两种创新方法,它们利用不同的 TT-核来有效地提取角度参数。
这项工作的主要贡献有三个方面,列举如下。
- 设计了一个 5-D 张量模型,以全面捕捉双基地 UPA-MIMO 雷达信号的时空结构。此外,为了增加自由度 (DOFs),通过对 5-D 张量进行自相关处理,推导出了具有范德蒙结构因子矩阵的 4-D 共阵张量。
- 采用张量列 SVD (tensor train SVD,TT-SVD) 算法将 4-D 共阵张量分解为四个相互连接的 TT-核,通过互连的图拓扑结构保留高维相关性。严格实现了 TT-核与范德蒙因子矩阵之间的精确映射。
- 开发了两种不同的角度估计方法。
- Type I 方法使用两阶段三线性 ALSs (TALs) 方法直接从 TT-核中提取角度,
- 而 Type II 方法合并第二和第三个 TT-核以进行一步 TALS 优化。
这两种方法保证了 2D-DOD 和 2D-DOA 估计值的固有配对,而无需额外的对齐。
定义 4 (TTD):对于高阶张量 X ∈ C I 1 × I 2 × ⋯ × I N \mathcal{X} \in \mathbb{C}^{I_1 \times I_2 \times \cdots \times I_N} X∈CI1×I2×⋯×IN,其 TTD 表示为
X = ∑ k 1 = 1 K 1 ∑ k 2 = 1 K 2 ⋯ ∑ k N − 1 = 1 K N − 1 G 1 ( : , k 1 ) ∘ G 2 ( k 1 , : , k 2 ) ∘ ⋯ ∘ G N − 1 ( k N − 2 , : , k N − 1 ) ∘ G N ( k N − 1 , : ) (4) \mathcal{X} = \sum_{k_1=1}^{K_1} \sum_{k_2=1}^{K_2} \cdots \sum_{k_{N-1}=1}^{K_{N-1}} \boldsymbol{G}_1(:, k_1) \circ \mathcal{G}_2(k_1, :, k_2) \circ \cdots \circ \mathcal{G}_{N-1}(k_{N-2}, :, k_{N-1}) \circ \boldsymbol{G}_N(k_{N-1}, :) \tag{4} X=k1=1∑K1k2=1∑K2⋯kN−1=1∑KN−1G1(:,k1)∘G2(k1,:,k2)∘⋯∘GN−1(kN−2,:,kN−1)∘GN(kN−1,:)(4)
其中 [ K 1 , K 2 , … , K N − 1 ] [K_1, K_2, \ldots, K_{N-1}] [K1,K2,…,KN−1] 表示 TT-秩, G 1 ∈ C I 1 × K 1 \boldsymbol{G}_1 \in \mathbb{C}^{I_1 \times K_1} G1∈CI1×K1 是首矩阵, G N ∈ C K N − 1 × I N \boldsymbol{G}_N \in \mathbb{C}^{K_{N-1} \times I_N} GN∈CKN−1×IN 是尾矩阵, G n ∈ C K n − 1 × I n × K n \mathcal{G}_n \in \mathbb{C}^{K_{n-1} \times I_n \times K_n} Gn∈CKn−1×In×Kn,且 n = 2 , 3 , … , N − 1 n = 2, 3, \ldots, N-1 n=2,3,…,N−1 代表 3-D TT-核张量。
定义 5 (张量收缩积,Tensor contraction product,TCP):对于两个高阶张量 X ∈ C I 1 × I 2 × ⋯ × I N \mathcal{X} \in \mathbb{C}^{I_1 \times I_2 \times \cdots \times I_N} X∈CI1×I2×⋯×IN 和 Y ∈ C J 1 × J 2 × ⋯ × J M \mathcal{Y} \in \mathbb{C}^{J_1 \times J_2 \times \cdots \times J_M} Y∈CJ1×J2×⋯×JM,其中 I n = J m I_n = J_m In=Jm,它们的收缩积是一个阶数为 I N + J M − 2 I_N + J_M - 2 IN+JM−2 的张量,可以表示为
[ X × n m Y ] ( i 1 , … , i n − 1 , i n + 1 , … , i N ⏟ 来自 X 的剩余索引 , j 1 , … , j m − 1 , j m + 1 , … , j M ⏟ 来自 Y 的剩余索引 ) = ∑ k = 1 I n X ( i 1 , … , i n − 1 , k , i n + 1 , … , i N ) ⋅ Y ( j 1 , … , j m − 1 , k , j m + 1 , … , j M ) \begin{aligned} &~~~~~[\mathcal{X} \times_n^m \mathcal{Y}](\underbrace{i_1, \ldots, i_{n-1}, i_{n+1}, \ldots, i_N}_{\text{来自 } \mathcal{X} \text{ 的剩余索引}}, \underbrace{j_1, \ldots, j_{m-1}, j_{m+1}, \ldots, j_M}_{\text{来自 } \mathcal{Y} \text{ 的剩余索引}}) \\ &= \sum_{k=1}^{I_n} \mathcal{X}(i_1, \ldots, i_{n-1}, \boldsymbol{k}, i_{n+1}, \ldots, i_N) \cdot \mathcal{Y}(j_1, \ldots, j_{m-1}, \boldsymbol{k}, j_{m+1}, \ldots, j_M) \end{aligned} [X×nmY](来自 X 的剩余索引 i1,…,in−1,in+1,…,iN,来自 Y 的剩余索引 j1,…,jm−1,jm+1,…,jM)=k=1∑InX(i1,…,in−1,k,in+1,…,iN)⋅Y(j1,…,jm−1,k,jm+1,…,jM)
III. SYSTEM MODEL

IV. COARRAY TTD
A. Tensor Train Core Tensors Estimation
受先前工作的启发,本研究采用 TTD 来估计具有均匀平面阵列 (UPA) 配置的双基地 MIMO 雷达系统中的 2D-DOD 和 2D-DOA。此外,开发了两种利用不同的 TT-核来有效提取角度参数的创新方法。
根据定义 6,双基地 MIMO 雷达中 TUPA 和 RUPA 的差分共阵(difference coarray)可以通过在 8-D 张量 R \mathcal{R} R 中组合因子向量对 { a t x ( μ t k ) , a t x ∗ ( μ t k ) } \{\boldsymbol{a}_{tx}(\mu_{tk}), \boldsymbol{a}_{tx}^*(\mu_{tk})\} {atx(μtk),atx∗(μtk)}, { a t y ( v t k ) , a t y ∗ ( v t k ) } \{\boldsymbol{a}_{ty}(v_{tk}), \boldsymbol{a}_{ty}^*(v_{tk})\} {aty(vtk),aty∗(vtk)}, { a r x ( μ r k ) , a r x ∗ ( μ r k ) } \{\boldsymbol{a}_{rx}(\mu_{rk}), \boldsymbol{a}_{rx}^*(\mu_{rk})\} {arx(μrk),arx∗(μrk)} 和 { a r y ( v r k ) , a r y ∗ ( v r k ) } \{\boldsymbol{a}_{ry}(v_{rk}), \boldsymbol{a}_{ry}^*(v_{rk})\} {ary(vrk),ary∗(vrk)} 来获得。因此,通过定义维度对 { 1 , 5 } \{1, 5\} {1,5}, { 2 , 6 } \{2, 6\} {2,6}, { 3 , 7 } \{3, 7\} {3,7} 和 { 4 , 8 } \{4, 8\} {4,8},可以推导出重排的 4-D 张量 R 1 = R { 1 , 5 } , { 2 , 6 } , { 3 , 7 } , { 4 , 8 } \mathcal{R}_1 = \mathcal{R}_{\{1,5\},\{2,6\},\{3,7\},\{4,8\}} R1=R{1,5},{2,6},{3,7},{4,8} 如下:
R 1 = ∑ k = 1 K σ k 2 ( a t x ( μ t k ) ⊗ a t x ∗ ( μ t k ) ) ∘ ( a t y ( v t k ) ⊗ a t y ∗ ( v t k ) ) ∘ ( a r x ( μ r k ) ⊗ a r x ∗ ( μ r k ) ) ∘ ( a r y ( v r k ) ⊗ a r y ∗ ( v r k ) ) . (20) \begin{aligned} \mathcal{R}_1 = \sum_{k=1}^K \sigma_k^2 (\boldsymbol{a}_{tx}(\mu_{tk}) \otimes \boldsymbol{a}_{tx}^*(\mu_{tk})) \circ (\boldsymbol{a}_{ty}(v_{tk}) \otimes \boldsymbol{a}_{ty}^*(v_{tk})) \\ \circ (\boldsymbol{a}_{rx}(\mu_{rk}) \otimes \boldsymbol{a}_{rx}^*(\mu_{rk})) \circ (\boldsymbol{a}_{ry}(v_{rk}) \otimes \boldsymbol{a}_{ry}^*(v_{rk})) . \end{aligned} \tag{20} R1=k=1∑Kσk2(atx(μtk)⊗atx∗(μtk))∘(aty(vtk)⊗aty∗(vtk))∘(arx(μrk)⊗arx∗(μrk))∘(ary(vrk)⊗ary∗(vrk)).(20)
张量 R 1 \mathcal{R}_1 R1 中因子向量 a t x ( μ t k ) ⊗ a t x ∗ ( μ t k ) \boldsymbol{a}_{tx}(\mu_{tk}) \otimes \boldsymbol{a}_{tx}^*(\mu_{tk}) atx(μtk)⊗atx∗(μtk), a t y ( v t k ) ⊗ a t y ∗ ( v t k ) \boldsymbol{a}_{ty}(v_{tk}) \otimes \boldsymbol{a}_{ty}^*(v_{tk}) aty(vtk)⊗aty∗(vtk), a r x ( μ r k ) ⊗ a r x ∗ ( μ r k ) \boldsymbol{a}_{rx}(\mu_{rk}) \otimes \boldsymbol{a}_{rx}^*(\mu_{rk}) arx(μrk)⊗arx∗(μrk) 和 a r y ( v r k ) ⊗ a r y ∗ ( v r k ) \boldsymbol{a}_{ry}(v_{rk}) \otimes \boldsymbol{a}_{ry}^*(v_{rk}) ary(vrk)⊗ary∗(vrk) 的位置包含许多重复元素。因此,为了消除冗余元素,本研究定义了差分共阵,并确定 TUPA 和 RUPA 的差分共阵中唯一的连续位置如下:
D c = { s c 1 − s c 2 ∣ s c 1 , s c 2 ∈ [ 0 , S c − 1 ] } s.t. c ∈ { t1, t2, r1, r2 } , S c ∈ { M 1 , M 2 , N 1 , N 2 } (21) \begin{aligned} \mathbb{D}_c =& \{s_{c1} - s_{c2} | s_{c1}, s_{c2} \in [0, S_c - 1]\} \\ &\text{s.t. } c \in \{\text {t1, t2, r1, r2}\}, \quad S_c \in \{M_1, M_2, N_1, N_2\} \end{aligned} \tag{21} Dc={sc1−sc2∣sc1,sc2∈[0,Sc−1]}s.t. c∈{t1, t2, r1, r2},Sc∈{M1,M2,N1,N2}(21)
以及
P c = [ d c 1 ∣ − ( S c − 1 ) ≤ d c 1 ≤ S c − 1 ] s.t. c ∈ { t1, t2, r1, r2 } , S c ∈ { M 1 , M 2 , N 1 , N 2 } . (22) \begin{aligned} \mathbb{P}_c &= [d_{c1} | -(S_c - 1) \le d_{c1} \le S_c - 1] \\ &\text{s.t. } c \in \{ \text { t1, t2, r1, r2}\}, \quad S_c \in \{M_1, M_2, N_1, N_2\}. \end{aligned} \tag{22} Pc=[dc1∣−(Sc−1)≤dc1≤Sc−1]s.t. c∈{ t1, t2, r1, r2},Sc∈{M1,M2,N1,N2}.(22)
本研究提供了一个示例以演示差分共阵是如何构造的,旨在更好地理解推导过程。设 ( M 1 , M 2 ) = ( 4 , 5 ) (M_1, M_2) = (4, 5) (M1,M2)=(4,5),则 TUPA 的差分共阵可以表示如下:
D t 1 = [ 0 , − 1 , − 2 , − 3 , 1 , 0 , − 1 , − 2 , 2 , 1 , 0 , − 1 , 3 , 2 , 1 , 0 ] (23a) \begin{aligned} \mathbb{D}_{t1} &= [0, -1, -2, -3, 1, 0, -1, -2, 2, 1, 0, \\ &\quad -1, 3, 2, 1, 0] \end{aligned} \tag{23a} Dt1=[0,−1,−2,−3,1,0,−1,−2,2,1,0,−1,3,2,1,0](23a)
D t 2 = [ 0 , − 1 , − 2 , − 3 , − 4 , 1 , 0 , − 1 , − 2 , − 3 , 2 , 1 , 0 , − 1 , − 2 , 3 , 2 , 1 , 0 , − 1 , 4 , 3 , 2 , 1 , 0 ] . (23b) \begin{aligned} \mathbb{D}_{t2} &= [0, -1, -2, -3, -4, 1, 0, -1, -2, -3, 2, 1, 0, \\ &\quad -1, -2, 3, 2, 1, 0, -1, 4, 3, 2, 1, 0]. \end{aligned} \tag{23b} Dt2=[0,−1,−2,−3,−4,1,0,−1,−2,−3,2,1,0,−1,−2,3,2,1,0,−1,4,3,2,1,0].(23b)
分析表明,TUPA 的差分共阵包含大量冗余元素。特别是, P t 1 \mathbb{P}_{t1} Pt1 和 P t 2 \mathbb{P}_{t2} Pt2 中的共阵索引分别为 [ − 3 , − 2 , − 1 , 0 , 1 , 2 , 3 ] [-3, -2, -1, 0, 1, 2, 3] [−3,−2,−1,0,1,2,3] 和 [ − 4 , − 3 , − 2 , − 1 , 0 , 1 , 2 , 3 , 4 ] [-4, -3, -2, -1, 0, 1, 2, 3, 4] [−4,−3,−2,−1,0,1,2,3,4]。为了解决这种冗余,本研究使用专用的选择矩阵来消除 TUPA 差分共阵中的重复值。为了获得 TUPA 和 RUPA 的唯一连续值,四个选择矩阵表示为 J 1 ∈ C ( 2 M 1 − 1 ) × M 1 2 \boldsymbol{J}_1 \in \mathbb{C}^{(2M_1-1) \times M_1^2} J1∈C(2M1−1)×M12,
J 2 ∈ C ( 2 M 2 − 1 ) × M 2 2 \boldsymbol{J}_2 \in \mathbb{C}^{(2M_2-1) \times M_2^2} J2∈C(2M2−1)×M22, J 3 ∈ C ( 2 N 1 − 1 ) × N 1 2 \boldsymbol{J}_3 \in \mathbb{C}^{(2N_1-1) \times N_1^2} J3∈C(2N1−1)×N12,和 J 4 ∈ C ( 2 N 2 − 1 ) × N 2 2 \boldsymbol{J}_4 \in \mathbb{C}^{(2N_2-1) \times N_2^2} J4∈C(2N2−1)×N22 定义如下:
J 1 ( i t 1 , j t 1 ) = { 1 w t 1 ( i t 1 ) , D t 1 ( j t 1 ) = P t 1 ( i t 1 ) 0 , elsewise (24a) \boldsymbol{J}_1(i_{t1}, j_{t1}) = \begin{cases} \frac{1}{w_{t1}(i_{t1})}, & \mathbb{D}_{t1}(j_{t1}) = \mathbb{P}_{t1}(i_{t1}) \\ 0, & \text{elsewise} \end{cases} \tag{24a} J1(it1,jt1)={wt1(it1)1,0,Dt1(jt1)=Pt1(it1)elsewise(24a)
J 2 ( i t 2 , j t 2 ) = { 1 w t 2 ( i t 2 ) , D t 2 ( j t 2 ) = P t 2 ( i t 2 ) 0 , elsewise (24b) \boldsymbol{J}_2(i_{t2}, j_{t2}) = \begin{cases} \frac{1}{w_{t2}(i_{t2})}, & \mathbb{D}_{t2}(j_{t2}) = \mathbb{P}_{t2}(i_{t2}) \\ 0, & \text{elsewise} \end{cases} \tag{24b} J2(it2,jt2)={wt2(it2)1,0,Dt2(jt2)=Pt2(it2)elsewise(24b)
J 3 ( i r 1 , j r 1 ) = { 1 w r 1 ( i r 1 ) , D r 1 ( j r 1 ) = P r 1 ( i r 1 ) 0 , elsewise (24c) \boldsymbol{J}_3(i_{r1}, j_{r1}) = \begin{cases} \frac{1}{w_{r1}(i_{r1})}, & \mathbb{D}_{r1}(j_{r1}) = \mathbb{P}_{r1}(i_{r1}) \\ 0, & \text{elsewise} \end{cases} \tag{24c} J3(ir1,jr1)={wr1(ir1)1,0,Dr1(jr1)=Pr1(ir1)elsewise(24c)
J 4 ( i r 2 , j r 2 ) = { 1 w r 2 ( i r 2 ) , D r 2 ( j r 2 ) = P r 2 ( i r 2 ) 0 , elsewise (24d) \boldsymbol{J}_4(i_{r2}, j_{r2}) = \begin{cases} \frac{1}{w_{r2}(i_{r2})}, & \mathbb{D}_{r2}(j_{r2}) = \mathbb{P}_{r2}(i_{r2}) \\ 0, & \text{elsewise} \end{cases} \tag{24d} J4(ir2,jr2)={wr2(ir2)1,0,Dr2(jr2)=Pr2(ir2)elsewise(24d)
其中 w t 1 ( i t 1 ) w_{t1}(i_{t1}) wt1(it1), w t 2 ( i t 2 ) w_{t2}(i_{t2}) wt2(it2), w r 1 ( i r 1 ) w_{r1}(i_{r1}) wr1(ir1),和 w r 2 ( i r 2 ) w_{r2}(i_{r2}) wr2(ir2) 表示 定义 7 中定义的加权函数。因此,一个新的 4-D 张量可以表示如下:
X = R 1 × 1 J 1 × 2 J 2 × 3 J 3 × 4 J 4 = ∑ k = 1 K σ k 2 a ^ t x ( μ t k ) ∘ a ^ t y ( v t k ) ∘ a ^ r x ( μ r k ) ∘ a ^ r y ( v r k ) (25) \begin{aligned} \mathcal{X} &= \mathcal{R}_1 \times_1 \boldsymbol{J}_1 \times_2 \boldsymbol{J}_2 \times_3 \boldsymbol{J}_3 \times_4 \boldsymbol{J}_4 \\ &= \sum_{k=1}^K \sigma_k^2 \hat{\boldsymbol{a}}_{tx}(\mu_{tk}) \circ \hat{\boldsymbol{a}}_{ty}(v_{tk}) \circ \hat{\boldsymbol{a}}_{rx}(\mu_{rk}) \circ \hat{\boldsymbol{a}}_{ry}(v_{rk}) \end{aligned} \tag{25} X=R1×1J1×2J2×3J3×4J4=k=1∑Kσk2a^tx(μtk)∘a^ty(vtk)∘a^rx(μrk)∘a^ry(vrk)(25)
其中
a ^ t x ( μ t k ) = [ e j π ( 1 − I 1 ) 2 μ t k , … , 1 , … , e j π ( I 1 − 1 ) 2 μ t k ] T (26a) \hat{\boldsymbol{a}}_{tx}(\mu_{tk}) = \left[ e^{j\pi \frac{(1-I_1)}{2} \mu_{tk}}, \ldots, 1, \ldots, e^{j\pi \frac{(I_1-1)}{2} \mu_{tk}} \right]^T \tag{26a} a^tx(μtk)=[ejπ2(1−I1)μtk,…,1,…,ejπ2(I1−1)μtk]T(26a)
a ^ t y ( v t k ) = [ e j π ( 1 − I 2 ) 2 v t k , … , 1 , … , e j π ( I 2 − 1 ) 2 v t k ] T (26b) \hat{\boldsymbol{a}}_{ty}(v_{tk}) = \left[ e^{j\pi \frac{(1-I_2)}{2} v_{tk}}, \ldots, 1, \ldots, e^{j\pi \frac{(I_2-1)}{2} v_{tk}} \right]^T \tag{26b} a^ty(vtk)=[ejπ2(1−I2)vtk,…,1,…,ejπ2(I2−1)vtk]T(26b)
a ^ r x ( μ r k ) = [ e j π ( 1 − I 3 ) 2 μ r k , … , 1 , … , e j π ( I 3 − 1 ) 2 μ r k ] T (26c) \hat{\boldsymbol{a}}_{rx}(\mu_{rk}) = \left[ e^{j\pi \frac{(1-I_3)}{2} \mu_{rk}}, \ldots, 1, \ldots, e^{j\pi \frac{(I_3-1)}{2} \mu_{rk}} \right]^T \tag{26c} a^rx(μrk)=[ejπ2(1−I3)μrk,…,1,…,ejπ2(I3−1)μrk]T(26c)
a ^ r y ( v r k ) = [ e j π ( 1 − I 4 ) 2 v r k , … , 1 , … , e j π ( I 4 − 1 ) 2 v r k ] T (26d) \hat{\boldsymbol{a}}_{ry}(v_{rk}) = \left[ e^{j\pi \frac{(1-I_4)}{2} v_{rk}}, \ldots, 1, \ldots, e^{j\pi \frac{(I_4-1)}{2} v_{rk}} \right]^T \tag{26d} a^ry(vrk)=[ejπ2(1−I4)vrk,…,1,…,ejπ2(I4−1)vrk]T(26d)
其中 I 1 = 2 M 1 − 1 I_1 = 2M_1-1 I1=2M1−1, I 2 = 2 M 2 − 1 I_2 = 2M_2-1 I2=2M2−1, I 3 = 2 N 1 − 1 I_3 = 2N_1-1 I3=2N1−1,和 I 4 = 2 N 2 − 1 I_4 = 2N_2-1 I4=2N2−1 表示 TUPA 和 RUPA 的差分共阵中的最大值。
此外,定义 A ^ t x = [ a ^ t x ( μ t 1 ) , a ^ t x ( μ t 2 ) , … , a ^ t x ( μ t K ) ] ∈ C I 1 × K \hat{\boldsymbol{A}}_{tx} = [\hat{\boldsymbol{a}}_{tx}(\mu_{t1}), \hat{\boldsymbol{a}}_{tx}(\mu_{t2}), \ldots, \hat{\boldsymbol{a}}_{tx}(\mu_{tK})] \in \mathbb{C}^{I_1 \times K} A^tx=[a^tx(μt1),a^tx(μt2),…,a^tx(μtK)]∈CI1×K, A ^ t y = [ a ^ t y ( v t 1 ) , a ^ t y ( v t 2 ) , … , a ^ t y ( v t K ) ] ∈ C I 2 × K \hat{\boldsymbol{A}}_{ty} = [\hat{\boldsymbol{a}}_{ty}(v_{t1}), \hat{\boldsymbol{a}}_{ty}(v_{t2}), \ldots, \hat{\boldsymbol{a}}_{ty}(v_{tK})] \in \mathbb{C}^{I_2 \times K} A^ty=[a^ty(vt1),a^ty(vt2),…,a^ty(vtK)]∈CI2×K, A ^ r x = [ a ^ r x ( μ r 1 ) , a ^ r x ( μ r 2 ) , … , a ^ r x ( μ r K ) ] ∈ C I 3 × K \hat{\boldsymbol{A}}_{rx} = [\hat{\boldsymbol{a}}_{rx}(\mu_{r1}), \hat{\boldsymbol{a}}_{rx}(\mu_{r2}), \ldots, \hat{\boldsymbol{a}}_{rx}(\mu_{rK})] \in \mathbb{C}^{I_3 \times K} A^rx=[a^rx(μr1),a^rx(μr2),…,a^rx(μrK)]∈CI3×K,以及 A ^ r y = [ a ^ r y ( v r 1 ) , a ^ r y ( v r 2 ) , … , a ^ r y ( v r K ) ] ∈ C I 4 × K \hat{\boldsymbol{A}}_{ry} = [\hat{\boldsymbol{a}}_{ry}(v_{r1}), \hat{\boldsymbol{a}}_{ry}(v_{r2}), \ldots, \hat{\boldsymbol{a}}_{ry}(v_{rK})] \in \mathbb{C}^{I_4 \times K} A^ry=[a^ry(vr1),a^ry(vr2),…,a^ry(vrK)]∈CI4×K。那么,4-D 张量 X \mathcal{X} X 可以进一步表示为广义范德蒙 CPD 格式,如下所示:
X = V × 1 A ^ t x × 2 A ^ t y × 3 A ^ r x × 4 A ^ r y (27) \mathcal{X} = \mathcal{V} \times_1 \hat{\boldsymbol{A}}_{tx} \times_2 \hat{\boldsymbol{A}}_{ty} \times_3 \hat{\boldsymbol{A}}_{rx} \times_4 \hat{\boldsymbol{A}}_{ry} \tag{27} X=V×1A^tx×2A^ty×3A^rx×4A^ry(27)
其中 V ∈ C K × K × K × K \mathcal{V} \in \mathbb{C}^{K \times K \times K \times K} V∈CK×K×K×K 表示一个 4-D 对角张量,其元素为 [ V ] k , k , k , k = σ k 2 [\mathcal{V}]_{k,k,k,k} = \sigma_k^2 [V]k,k,k,k=σk2。
其中
a ^ t x ( μ t k ) = [ e j π ( 1 − I 1 ) 2 μ t k , … , 1 , … , e j π ( I 1 − 1 ) 2 μ t k ] T (26a) \hat{\boldsymbol{a}}_{tx}(\mu_{tk}) = \left[ e^{j\pi \frac{(1-I_1)}{2} \mu_{tk}}, \ldots, 1, \ldots, e^{j\pi \frac{(I_1-1)}{2} \mu_{tk}} \right]^T \tag{26a} a^tx(μtk)=[ejπ2(1−I1)μtk,…,1,…,ejπ2(I1−1)μtk]T(26a)
a ^ t y ( v t k ) = [ e j π ( 1 − I 2 ) 2 v t k , … , 1 , … , e j π ( I 2 − 1 ) 2 v t k ] T (26b) \hat{\boldsymbol{a}}_{ty}(v_{tk}) = \left[ e^{j\pi \frac{(1-I_2)}{2} v_{tk}}, \ldots, 1, \ldots, e^{j\pi \frac{(I_2-1)}{2} v_{tk}} \right]^T \tag{26b} a^ty(vtk)=[ejπ2(1−I2)vtk,…,1,…,ejπ2(I2−1)vtk]T(26b)
a ^ r x ( μ r k ) = [ e j π ( 1 − I 3 ) 2 μ r k , … , 1 , … , e j π ( I 3 − 1 ) 2 μ r k ] T (26c) \hat{\boldsymbol{a}}_{rx}(\mu_{rk}) = \left[ e^{j\pi \frac{(1-I_3)}{2} \mu_{rk}}, \ldots, 1, \ldots, e^{j\pi \frac{(I_3-1)}{2} \mu_{rk}} \right]^T \tag{26c} a^rx(μrk)=[ejπ2(1−I3)μrk,…,1,…,ejπ2(I3−1)μrk]T(26c)
a ^ r y ( v r k ) = [ e j π ( 1 − I 4 ) 2 v r k , … , 1 , … , e j π ( I 4 − 1 ) 2 v r k ] T (26d) \hat{\boldsymbol{a}}_{ry}(v_{rk}) = \left[ e^{j\pi \frac{(1-I_4)}{2} v_{rk}}, \ldots, 1, \ldots, e^{j\pi \frac{(I_4-1)}{2} v_{rk}} \right]^T \tag{26d} a^ry(vrk)=[ejπ2(1−I4)vrk,…,1,…,ejπ2(I4−1)vrk]T(26d)
其中 I 1 = 2 M 1 − 1 I_1 = 2M_1-1 I1=2M1−1, I 2 = 2 M 2 − 1 I_2 = 2M_2-1 I2=2M2−1, I 3 = 2 N 1 − 1 I_3 = 2N_1-1 I3=2N1−1, 和 I 4 = 2 N 2 − 1 I_4 = 2N_2-1 I4=2N2−1 表示 TUPA 和 RUPA 的差分共阵中的最大值。
此外,定义 A ^ t x = [ a ^ t x ( μ t 1 ) , a ^ t x ( μ t 2 ) , … , a ^ t x ( μ t K ) ] ∈ C I 1 × K \hat{\boldsymbol{A}}_{tx} = [\hat{\boldsymbol{a}}_{tx}(\mu_{t1}), \hat{\boldsymbol{a}}_{tx}(\mu_{t2}), \ldots, \hat{\boldsymbol{a}}_{tx}(\mu_{tK})] \in \mathbb{C}^{I_1 \times K} A^tx=[a^tx(μt1),a^tx(μt2),…,a^tx(μtK)]∈CI1×K, A ^ t y = [ a ^ t y ( v t 1 ) , a ^ t y ( v t 2 ) , … , a ^ t y ( v t K ) ] ∈ C I 2 × K \hat{\boldsymbol{A}}_{ty} = [\hat{\boldsymbol{a}}_{ty}(v_{t1}), \hat{\boldsymbol{a}}_{ty}(v_{t2}), \ldots, \hat{\boldsymbol{a}}_{ty}(v_{tK})] \in \mathbb{C}^{I_2 \times K} A^ty=[a^ty(vt1),a^ty(vt2),…,a^ty(vtK)]∈CI2×K, A ^ r x = [ a ^ r x ( μ r 1 ) , a ^ r x ( μ r 2 ) , … , a ^ r x ( μ r K ) ] ∈ C I 3 × K \hat{\boldsymbol{A}}_{rx} = [\hat{\boldsymbol{a}}_{rx}(\mu_{r1}), \hat{\boldsymbol{a}}_{rx}(\mu_{r2}), \ldots, \hat{\boldsymbol{a}}_{rx}(\mu_{rK})] \in \mathbb{C}^{I_3 \times K} A^rx=[a^rx(μr1),a^rx(μr2),…,a^rx(μrK)]∈CI3×K, 以及 A ^ r y = [ a ^ r y ( v r 1 ) , a ^ r y ( v r 2 ) , … , a ^ r y ( v r K ) ] ∈ C I 4 × K \hat{\boldsymbol{A}}_{ry} = [\hat{\boldsymbol{a}}_{ry}(v_{r1}), \hat{\boldsymbol{a}}_{ry}(v_{r2}), \ldots, \hat{\boldsymbol{a}}_{ry}(v_{rK})] \in \mathbb{C}^{I_4 \times K} A^ry=[a^ry(vr1),a^ry(vr2),…,a^ry(vrK)]∈CI4×K。那么,4-D 张量 X \mathcal{X} X 可以进一步表示为广义范德蒙 CPD 格式,如下所示:
X = V × 1 A ^ t x × 2 A ^ t y × 3 A ^ r x × 4 A ^ r y (27) \mathcal{X} = \mathcal{V} \times_1 \hat{\boldsymbol{A}}_{tx} \times_2 \hat{\boldsymbol{A}}_{ty} \times_3 \hat{\boldsymbol{A}}_{rx} \times_4 \hat{\boldsymbol{A}}_{ry} \tag{27} X=V×1A^tx×2A^ty×3A^rx×4A^ry(27)
其中 V ∈ C K × K × K × K \mathcal{V} \in \mathbb{C}^{K \times K \times K \times K} V∈CK×K×K×K 表示一个 4-D 对角张量,其元素为 [ V ] k , k , k , k = σ k 2 [\mathcal{V}]_{k,k,k,k} = \sigma_k^2 [V]k,k,k,k=σk2。
然而,CPD 难以识别高维张量的最佳低秩表示,且该问题已知为 NP-hard 问题。此外,CPD 的 ALSs 算法在高维张量分解过程中会遇到一些关于鲁棒性和收敛性的挑战。
为了解决这些挑战,最近的工作引入了 TTD 方法 [32]。该方法使用灵活且计算高效的框架将高维张量分解为相互连接的三阶核心张量。TTD 方法的关键优势有两个:
-
- 分解后的核心张量表现出更简单的结构,以及
-
- 参数的数量随张量阶数线性缩放。差分共阵张量 X \mathcal{X} X 的 TTD 表示如下:
X = ∑ k = 1 K ∑ k = 1 K ∑ k = 1 K G 1 ( : , k ) ∘ G 2 ( k , : , k ) ∘ G 3 ( k , : , k ) ∘ G 4 ( k , : ) (28) \begin{aligned} \mathcal{X} = \sum_{k=1}^K \sum_{k=1}^K \sum_{k=1}^K \boldsymbol{G}_1(:, k) \circ \mathcal{G}_2(k, :, k) \\ \circ \mathcal{G}_3(k, :, k) \circ \boldsymbol{G}_4(k, :) \end{aligned} \tag{28} X=k=1∑Kk=1∑Kk=1∑KG1(:,k)∘G2(k,:,k)∘G3(k,:,k)∘G4(k,:)(28)
其中 G 1 ∈ C I 1 × K \boldsymbol{G}_1 \in \mathbb{C}^{I_1 \times K} G1∈CI1×K 表示首矩阵, G 4 ∈ C K × I 4 \boldsymbol{G}_4 \in \mathbb{C}^{K \times I_4} G4∈CK×I4 是尾矩阵,而 G 2 ( k , : , k ) \mathcal{G}_2(k, :, k) G2(k,:,k) 和 G 3 ( k , : , k ) \mathcal{G}_3(k, :, k) G3(k,:,k) 分别表示 G 2 ∈ C K × I 2 × K \mathcal{G}_2 \in \mathbb{C}^{K \times I_2 \times K} G2∈CK×I2×K 和 G 3 ∈ C K × I 3 × K \mathcal{G}_3 \in \mathbb{C}^{K \times I_3 \times K} G3∈CK×I3×K 的垂直纤维(vertical fibers)。
此外,基于相邻核心张量之间的 TCP, X \mathcal{X} X 的格式可以表示为
X = G 1 × 2 1 G 2 × 3 1 G 3 × 4 1 G 4 . (29) \mathcal{X} = \boldsymbol{G}_1 \times_2^1 \mathcal{G}_2 \times_3^1 \mathcal{G}_3 \times_4^1 \boldsymbol{G}_4. \tag{29} X=G1×21G2×31G3×41G4.(29)

张量 X \mathcal{X} X 的 CPD 和 TTD 格式的图形表示如图 2 所示。在随后的分析中,将讨论同一高维张量的 CPD 和 TTD 之间的关系。首先,对于 (27) 中的 4-D 对角张量 V \mathcal{V} V,其 TTD 定义如下:
V = V × 2 1 I 3 , K × 3 1 I 3 , K × 4 1 I K (30) \mathcal{V} = \boldsymbol{V} \times_2^1 \mathcal{I}_{3,K} \times_3^1 \mathcal{I}_{3,K} \times_4^1 \boldsymbol{I}_K \tag{30} V=V×21I3,K×31I3,K×41IK(30)
其中 V = diag [ σ 1 2 , σ 2 2 , … , σ K 2 ] ∈ C K × K \boldsymbol{V} = \text{diag}[\sigma_1^2, \sigma_2^2, \ldots, \sigma_K^2] \in \mathbb{C}^{K \times K} V=diag[σ12,σ22,…,σK2]∈CK×K, I 3 , K ∈ C K × K × K \mathcal{I}_{3,K} \in \mathbb{C}^{K \times K \times K} I3,K∈CK×K×K, 和 I K ∈ C K × K \boldsymbol{I}_K \in \mathbb{C}^{K \times K} IK∈CK×K。
然后,结合 (27) 和 (30) 可得
X = ( V × 2 1 I 3 , K × 3 1 I 3 , K × 4 1 I K ) × 1 A ^ t x × 2 A ^ t y × 3 A ^ r x × 4 A ^ r y = ( A ^ t x V ) × 2 1 A ^ t y × 3 1 A ^ r x × 4 1 A ^ r y T (31) \begin{aligned} \mathcal{X} &= (\boldsymbol{V} \times_2^1 \mathcal{I}_{3,K} \times_3^1 \mathcal{I}_{3,K} \times_4^1 \boldsymbol{I}_K) \times_1 \hat{\boldsymbol{A}}_{tx} \times_2 \hat{\boldsymbol{A}}_{ty} \times_3 \hat{\boldsymbol{A}}_{rx} \times_4 \hat{\boldsymbol{A}}_{ry} \\ &= (\hat{\boldsymbol{A}}_{tx} \boldsymbol{V}) \times_2^1 \hat{\boldsymbol{A}}_{ty} \times_3^1 \hat{\boldsymbol{A}}_{rx} \times_4^1 \hat{\boldsymbol{A}}_{ry}^T \end{aligned} \tag{31} X=(V×21I3,K×31I3,K×41IK)×1A^tx×2A^ty×3A^rx×4A^ry=(A^txV)×21A^ty×31A^rx×41A^ryT(31)
其中
A ^ t y = I 3 , K × 2 A ^ t y ∈ C K × I 2 × K (32a) \hat{\boldsymbol{A}}_{ty} = \mathcal{I}_{3,K} \times_2 \hat{\boldsymbol{A}}_{ty} \in \mathbb{C}^{K \times I_2 \times K} \tag{32a} A^ty=I3,K×2A^ty∈CK×I2×K(32a) A ^ r x = I 3 , K × 2 A ^ r x ∈ C K × I 3 × K . (32b) \hat{\boldsymbol{A}}_{rx} = \mathcal{I}_{3,K} \times_2 \hat{\boldsymbol{A}}_{rx} \in \mathbb{C}^{K \times I_3 \times K}. \tag{32b} A^rx=I3,K×2A^rx∈CK×I3×K.(32b)
此外,通过比较 (29) 和 (31),本研究推导出了 CPD 因子矩阵与 TT 核心张量之间的如下关系:
G 1 = A ^ tx V , G 2 = I 3 , K × 2 A ^ ty (33a) \boldsymbol{G}_1 = \hat{\boldsymbol{A}}_{\text{tx}}\boldsymbol{V}, \quad \mathcal{G}_2 = \mathcal{I}_{3,K} \times_2 \hat{\boldsymbol{A}}_{\text{ty}} \tag{33a} G1=A^txV,G2=I3,K×2A^ty(33a) G 3 = I 3 , K × 2 A ^ rx , G 4 = A ^ ry T (33b) \mathcal{G}_3 = \mathcal{I}_{3,K} \times_2 \hat{\boldsymbol{A}}_{\text{rx}}, \quad \boldsymbol{G}_4 = \hat{\boldsymbol{A}}_{\text{ry}}^T \tag{33b} G3=I3,K×2A^rx,G4=A^ryT(33b)
根据 (33b),核心张量 G 2 \mathcal{G}_2 G2 和 G 3 \mathcal{G}_3 G3 的水平纤维是对角矩阵,它们分别表示为
G 2 ( : , i 2 , : ) = diag ( A ^ ty ( i 2 , : ) ) , i 2 = 1 , 2 , … , I 2 (34a) \mathcal{G}_2(:, i_2, :) = \text{diag}(\hat{\boldsymbol{A}}_{\text{ty}}(i_2, :)), \quad i_2 = 1, 2, \dots, I_2 \tag{34a} G2(:,i2,:)=diag(A^ty(i2,:)),i2=1,2,…,I2(34a) G 3 ( : , i 3 , : ) = diag ( A ^ rx ( i 3 , : ) ) , i 3 = 1 , 2 , … , I 3 . (34b) \mathcal{G}_3(:, i_3, :) = \text{diag}(\hat{\boldsymbol{A}}_{\text{rx}}(i_3, :)), \quad i_3 = 1, 2, \dots, I_3 \tag{34b}. G3(:,i3,:)=diag(A^rx(i3,:)),i3=1,2,…,I3.(34b)
1. 基础定义:三阶单位张量 I 3 , K \mathcal{I}_{3,K} I3,K
类似于单位矩阵, I 3 , K \mathcal{I}_{3,K} I3,K 仅在体对角线上有值:
I 3 , K ( k 1 , k 2 , k 3 ) = { 1 , 若 k 1 = k 2 = k 3 0 , 其他情况 \mathcal{I}_{3,K}(k_1, k_2, k_3) = \begin{cases} 1, & \text{若 } k_1 = k_2 = k_3 \\ 0, & \text{其他情况} \end{cases} I3,K(k1,k2,k3)={1,0,若 k1=k2=k3其他情况
2. 模-2 乘积展开
根据公式 (33a) G 2 = I 3 , K × 2 A ^ ty \mathcal{G}_2 = \mathcal{I}_{3,K} \times_2 \hat{\boldsymbol{A}}_{\text{ty}} G2=I3,K×2A^ty,张量 G 2 \mathcal{G}_2 G2 的第 ( k 1 , i 2 , k 3 ) (k_1, i_2, k_3) (k1,i2,k3) 个元素为:
G 2 ( k 1 , i 2 , k 3 ) = ∑ m = 1 K I 3 , K ( k 1 , m , k 3 ) ⋅ A ^ ty ( i 2 , m ) \mathcal{G}_2(k_1, i_2, k_3) = \sum_{m=1}^{K} \mathcal{I}_{3,K}(k_1, m, k_3) \cdot \hat{\boldsymbol{A}}_{\text{ty}}(i_2, m) G2(k1,i2,k3)=m=1∑KI3,K(k1,m,k3)⋅A^ty(i2,m)
3. 利用稀疏性化简
观察求和项 I 3 , K ( k 1 , m , k 3 ) \mathcal{I}_{3,K}(k_1, m, k_3) I3,K(k1,m,k3):
- 非对角元素 ( k 1 ≠ k 3 k_1 \neq k_3 k1=k3):无论 m m m 取何值,三个索引无法同时相等, I 3 , K \mathcal{I}_{3,K} I3,K 恒为 0。
⇒ G 2 ( k 1 , i 2 , k 3 ) = 0 \Rightarrow \mathcal{G}_2(k_1, i_2, k_3) = 0 ⇒G2(k1,i2,k3)=0- 对角元素 ( k 1 = k 3 = k k_1 = k_3 = k k1=k3=k):仅当 m = k m=k m=k 时 I 3 , K \mathcal{I}_{3,K} I3,K 为 1,其余为 0。求和项只剩一项:
G 2 ( k , i 2 , k ) = 1 ⋅ A ^ ty ( i 2 , k ) = A ^ ty ( i 2 , k ) \mathcal{G}_2(k, i_2, k) = 1 \cdot \hat{\boldsymbol{A}}_{\text{ty}}(i_2, k) = \hat{\boldsymbol{A}}_{\text{ty}}(i_2, k) G2(k,i2,k)=1⋅A^ty(i2,k)=A^ty(i2,k)4. 切片结论 (Slice Representation)
固定中间索引 i 2 i_2 i2,考察水平纤维切片 G 2 ( : , i 2 , : ) \mathcal{G}_2(:, i_2, :) G2(:,i2,:):
- 由上述推导可知,该矩阵仅在对角线 ( k 1 = k 3 k_1=k_3 k1=k3) 上有值,且值为 A ^ ty \hat{\boldsymbol{A}}_{\text{ty}} A^ty 的第 i 2 i_2 i2 行元素。
- 因此,该切片是一个对角矩阵:
G 2 ( : , i 2 , : ) = diag ( A ^ ty ( i 2 , : ) ) \mathcal{G}_2(:, i_2, :) = \text{diag}(\hat{\boldsymbol{A}}_{\text{ty}}(i_2, :)) G2(:,i2,:)=diag(A^ty(i2,:))
(同理可得 G 3 \mathcal{G}_3 G3 与 A ^ rx \hat{\boldsymbol{A}}_{\text{rx}} A^rx 的关系)
上述关系表明,范德蒙因子矩阵 A ^ tx \hat{\boldsymbol{A}}_{\text{tx}} A^tx、 A ^ ty \hat{\boldsymbol{A}}_{\text{ty}} A^ty、 A ^ rx \hat{\boldsymbol{A}}_{\text{rx}} A^rx 和 A ^ ry \hat{\boldsymbol{A}}_{\text{ry}} A^ry 可以分别从 TT 核心 G 1 \boldsymbol{G}_1 G1、 G 2 \mathcal{G}_2 G2、 G 3 \mathcal{G}_3 G3 和 G 4 \boldsymbol{G}_4 G4 中提取。在本研究中,TT-SVD 被用于估计 TT 核心 G 1 \boldsymbol{G}_1 G1、 G 2 \mathcal{G}_2 G2、 G 3 \mathcal{G}_3 G3 和 G 4 \boldsymbol{G}_4 G4。遵循 [43] 中的推导,TT 核心可以定义为:
G 1 = A ^ tx V M 1 − 1 , G 2 = [ [ M 1 , A ^ ty , M 2 − T ] ] (35a) \boldsymbol{G}_1 = \hat{\boldsymbol{A}}_{\text{tx}}\boldsymbol{V}\boldsymbol{M}_1^{-1}, \quad \mathcal{G}_2 = [[\boldsymbol{M}_1, \hat{\boldsymbol{A}}_{\text{ty}}, \boldsymbol{M}_2^{-T}]] \tag{35a} G1=A^txVM1−1,G2=[[M1,A^ty,M2−T]](35a) G 3 = [ [ M 2 , A ^ rx , M 3 − T ] ] , G 4 = M 3 A ^ ry T (35b) \mathcal{G}_3 = [[\boldsymbol{M}_2, \hat{\boldsymbol{A}}_{\text{rx}}, \boldsymbol{M}_3^{-T}]], \quad \boldsymbol{G}_4 = \boldsymbol{M}_3\hat{\boldsymbol{A}}_{\text{ry}}^T \tag{35b} G3=[[M2,A^rx,M3−T]],G4=M3A^ryT(35b)
其中 { M k } k = 1 3 ∈ C K × K \{\boldsymbol{M}_k\}_{k=1}^3 \in \mathbb{C}^{K \times K} {Mk}k=13∈CK×K 表示非奇异基变换矩阵。
通过比较 (33b) 和 (35b),可以发现 X \mathcal{X} X 的 TT-SVD 并不提供唯一的 TT 核心 G 1 \boldsymbol{G}_1 G1、 G 2 \mathcal{G}_2 G2、 G 3 \mathcal{G}_3 G3 和 G 4 \boldsymbol{G}_4 G4;即,如下关系成立
X = A ^ tx V M 1 − 1 Q − 1 × 2 1 ( I 3 , K × 1 M 1 Q × 2 A ^ ty × 3 M 2 − 1 Q − 1 ) × 3 1 ( I 3 , K × 1 M 2 Q × 2 A ^ rx × 3 M 3 − 1 Q − 1 ) × 4 1 M 3 Q A ^ ry T = G ^ 1 × 2 1 G ^ 2 × 3 1 G ^ 3 × 4 1 G ^ 4 (36) \begin{aligned} \mathcal{X} &= \hat{\boldsymbol{A}}_{\text{tx}}\boldsymbol{V}\boldsymbol{M}_1^{-1}\boldsymbol{Q}^{-1}\\ & \quad \times_2^1 (\mathcal{I}_{3,K} \times_1 \boldsymbol{M}_1\boldsymbol{Q} \times_2 \hat{\boldsymbol{A}}_{\text{ty}} \times_3 \boldsymbol{M}_2^{-1}\boldsymbol{Q}^{-1}) \\ &\quad \times_3^1 (\mathcal{I}_{3,K} \times_1 \boldsymbol{M}_2\boldsymbol{Q} \times_2 \hat{\boldsymbol{A}}_{\text{rx}} \times_3 \boldsymbol{M}_3^{-1}\boldsymbol{Q}^{-1}) \\ &\quad \times_4^1 \boldsymbol{M}_3\boldsymbol{Q}\hat{\boldsymbol{A}}_{\text{ry}}^T \\ &= \hat{\boldsymbol{G}}_1 \times_2^1 \hat{G}_2 \times_3^1 \hat{G}_3 \times_4^1 \hat{\boldsymbol{G}}_4 \end{aligned} \tag{36} X=A^txVM1−1Q−1×21(I3,K×1M1Q×2A^ty×3M2−1Q−1)×31(I3,K×1M2Q×2A^rx×3M3−1Q−1)×41M3QA^ryT=G^1×21G^2×31G^3×41G^4(36)
其中
G ^ 1 = G 1 V Q − 1 , G ^ 2 = G 2 × 1 Q × 3 Q − 1 (37a) \hat{\boldsymbol{G}}_1 = \boldsymbol{G}_1\boldsymbol{V}\boldsymbol{Q}^{-1}, \quad \hat{G}_2 = \mathcal{G}_2 \times_1 \boldsymbol{Q} \times_3 \boldsymbol{Q}^{-1} \tag{37a} G^1=G1VQ−1,G^2=G2×1Q×3Q−1(37a) G ^ 3 = G 3 × 1 Q × 3 Q − 1 , G ^ 4 = Q G 4 (37b) \hat{G}_3= \mathcal{G}_3 \times_1 \boldsymbol{Q} \times_3 \boldsymbol{Q}^{-1}, \quad \hat{\boldsymbol{G}}_4 = \boldsymbol{Q}\boldsymbol{G}_4 \tag{37b} G^3=G3×1Q×3Q−1,G^4=QG4(37b)
其中 Q ∈ C K × K \boldsymbol{Q} \in \mathbb{C}^{K \times K} Q∈CK×K 代表一个可逆矩阵。
通过左乘不同的 Q \boldsymbol{Q} Q 矩阵,可以获得一组变换后的 TT 核心 G ^ 1 \hat{\boldsymbol{G}}_1 G^1、 G ^ 2 \hat{\mathcal{G}}_2 G^2、 G ^ 3 \hat{\mathcal{G}}_3 G^3 和 G ^ 4 \hat{\boldsymbol{G}}_4 G^4,这揭示了存在多种核心张量组合能够生成 X \mathcal{X} X 的相同 TT 表示。换句话说,在 G 1 \boldsymbol{G}_1 G1、 G 2 \mathcal{G}_2 G2、 G 3 \mathcal{G}_3 G3 和 G 4 \boldsymbol{G}_4 G4 中存在模糊性,这会影响范德蒙因子矩阵 A ^ tx \hat{\boldsymbol{A}}_{\text{tx}} A^tx、 A ^ ty \hat{\boldsymbol{A}}_{\text{ty}} A^ty、 A ^ rx \hat{\boldsymbol{A}}_{\text{rx}} A^rx 和 A ^ ry \hat{\boldsymbol{A}}_{\text{ry}} A^ry 的自动配对。
论文此处的字母表述非常的混乱
如图 3 所示,本研究提出了两种不同的估计策略:
- Type I 方法,其利用两个 TALS 算法直接从 G 2 \mathcal{G}_2 G2 和 G 3 \mathcal{G}_3 G3 中提取因子矩阵;
- 以及 Type II 方法,其采用单个 TALS 算法联合优化 G 2 \mathcal{G}_2 G2 和 G 3 \mathcal{G}_3 G3。
更多推荐


所有评论(0)