【目标跟踪: 相关滤波器四】相关滤波

相关滤波为本篇博文表述方便，特将前几篇中几个重要的公式在此一并贴出，不懂的可以去看前几篇博文。w=(XTX+λI)−1XTy(1){\bf{w}} = {({{\bf{X}}^{\rm{T}}}{\bf{X}} + \lambda {\bf{I}})^{ - 1}}{{\bf{X}}^{\rm{T}}}{\bf{y}}\tag{1}w=(XHX+λI)−1XHy(2){\bf{w}} = {

Kena_M

13213人浏览 · 2017-01-02 21:53:18

Kena_M · 2017-01-02 21:53:18 发布

相关滤波

为本篇博文表述方便，特将前几篇中几个重要的公式在此一并贴出，不懂的可以去看前几篇博文。

w = (X T X + λ I) - 1 X T y (1)

w = (X H X + λ I) - 1 X H y (2)

α = (K + λ I) - 1 y (3)

A + B = C (a + b) (4)

A \cdot B = C (F - 1 (F (a) ⊙ F (b))) (5)

X T = F \cdot d i a g (F * (x)) \cdot F H (6)

X - 1 = F \cdot d i a g (F (x)) - 1 \cdot F H (7)

F (X y) = F * (x) ⊙ F (y) (8)

线性相关滤波

首先考虑一维样本，即一行（N个）图像像素，每个样本只有一维特征，当使用线性岭回归时，其解为式(1)，其中的X<script type="math/tex" id="MathJax-Element-9">{\bf{X}}</script>本质上是一个列向量。当引入循环矩阵之后，每个样本的特征被对应的扩展为由所有样本组成的循环向量，即X<script type="math/tex" id="MathJax-Element-10">{\bf{X}}</script>成为一个N×N的矩阵，其图形化表示如下图所示。
这里写图片描述
循环矩阵是联系样本时域空间与频域空间的纽带，引入循环矩阵之后，线性岭回归的解为式(2)，其XHX<script type="math/tex" id="MathJax-Element-11">{{\bf{X}}^{\rm{H}}}{\bf{X}}</script>项可做如下简化：

X H X = F \cdot d i a g (F * (x)) \cdot F H \cdot F \cdot d i a g (F (x)) \cdot F H = F \cdot d i a g (F * (x)) \cdot d i a g (F (x)) \cdot F H = F \cdot d i a g (F * (x) ⊙ F (x)) \cdot F H

XHX<script type="math/tex" id="MathJax-Element-13">{{\bf{X}}^{\rm{H}}}{\bf{X}}</script>项也是循环矩阵，其中

F∗(x)⊙F(x)<script type="math/tex" id="MathJax-Element-14">{{\cal F}^ * }({\bf{x}}) \odot {\cal F}({\bf{x}})</script>项在信号处理领域称为自相关（auto-correlation）。考虑到单位矩阵

I<script type="math/tex" id="MathJax-Element-15">{\bf{I}}</script>是对角阵，

F<script type="math/tex" id="MathJax-Element-16">{\bf{F}}</script>是酉矩阵，根据循环矩阵的性质，则可继续简化如下：

w = (X H X + λ I) - 1 X H y = (F \cdot d i a g (F * (x) ⊙ F (x)) \cdot F H + λ I) - 1 \cdot F \cdot d i a g (F * (x)) \cdot F H \cdot y = (F \cdot d i a g (F * (x) ⊙ F (x) + λ) \cdot F H) - 1 \cdot F \cdot d i a g (F * (x)) \cdot F H \cdot y = F \cdot d i a g (F * (x) ⊙ F (x) + λ) - 1 \cdot F H \cdot F \cdot d i a g (F * (x)) \cdot F H \cdot y = F \cdot d i a g (F * ( x ) F * ( x ) ⊙ F ( x ) + λ) \cdot F H \cdot y

w<script type="math/tex" id="MathJax-Element-18">\bf{w}</script>转换到频域得：

F (w) = (F * ( x ) F * ( x ) ⊙ F ( x ) + λ) * ⊙ F (y) = F ( x ) ⊙ F ( y ) F ( x ) ⊙ F * ( x ) + λ (9)

w<script type="math/tex" id="MathJax-Element-20">{\bf{w}}</script>的时间复杂度为

O(N3)<script type="math/tex" id="MathJax-Element-21">O({N^3})</script>，当使用FFT时，该求解过程的时间复杂度则为

O(NlogN)<script type="math/tex" id="MathJax-Element-22">O(N\log N)</script>，在计算速度上有质的提升，而这也是相关滤波器能实现高速跟踪的核心所在。

核相关滤波

考虑使用核岭回归的情况，首先要构造核矩阵K<script type="math/tex" id="MathJax-Element-23">{\bf{K}}</script>，而且为了充分利用循环矩阵的性质实现快速计算，核矩阵K<script type="math/tex" id="MathJax-Element-24">{\bf{K}}</script>必须是循环矩阵。
根据核函数的定义：Kij=κ(xi,xj)=⟨φ(xi),φ(xj)⟩<script type="math/tex" id="MathJax-Element-25">{{\bf{K}}_{ij}} = \kappa ({{\bf{x}}_i},{{\bf{x}}_j}) = \left\langle {\varphi ({{\bf{x}}_i}),\varphi ({{\bf{x}}_j})} \right\rangle </script>，其中xi<script type="math/tex" id="MathJax-Element-26">{{\bf{x}}_i}</script>表示第i<script type="math/tex" id="MathJax-Element-27">i</script>个样本。在由一维样本x<script type="math/tex" id="MathJax-Element-28">{\bf{x}}</script>生成的循环矩阵X<script type="math/tex" id="MathJax-Element-29">{\bf{X}}</script>中，xi<script type="math/tex" id="MathJax-Element-30">{{\bf{x}}_i}</script>泛化为X<script type="math/tex" id="MathJax-Element-31">{\bf{X}}</script>的第i<script type="math/tex" id="MathJax-Element-32">i</script>行元素。则K<script type="math/tex" id="MathJax-Element-33">{\bf{K}}</script>的第i<script type="math/tex" id="MathJax-Element-34">i</script>行元素为：Ki=κ(xi,x)=⟨φ(xi),φ(x)⟩<script type="math/tex" id="MathJax-Element-35">{{\bf{K}}_i} = \kappa ({{\bf{x}}_i},{\bf{x}}) = \left\langle {\varphi ({{\bf{x}}_i}),\varphi ({\bf{x}})} \right\rangle </script>，即X<script type="math/tex" id="MathJax-Element-36">{\bf{X}}</script>的所有行元素与第i<script type="math/tex" id="MathJax-Element-37">i</script>行元素在由映射函数φ(⋅)<script type="math/tex" id="MathJax-Element-38">\varphi ( \cdot )</script>定义的希尔伯特空间中的内积。K<script type="math/tex" id="MathJax-Element-39">{\bf{K}}</script>的每一行元素都是遍历了X<script type="math/tex" id="MathJax-Element-40">{\bf{X}}</script>中的所有元素生成的，只是顺序有所不同，故核矩阵K<script type="math/tex" id="MathJax-Element-41">{\bf{K}}</script>必定是循环矩阵。
根据循环矩阵的性质，对式（3）进行简化：

α = (K + λ I) - 1 y = (F \cdot d i a g (F (k x x)) \cdot F H + λ I) - 1 \cdot y = F \cdot d i a g (F (k x x) + λ) - 1 \cdot F H \cdot y

kxx<script type="math/tex" id="MathJax-Element-43">{{\bf{k}}^{{\bf{xx}}}}</script>表示由一维样本

x<script type="math/tex" id="MathJax-Element-44">{\bf{x}}</script>生成的自相关核向量，根据式（8），则有：

F (α) = (1 F ( k x x ) + λ) * ⊙ F (y) = F ( y ) F ( k x x ) + λ (10)

1.线性核函数

{k x z = κ (x, z) = x T z F (k x z) = F * (x) ⊙ F (z) (11)

z<script type="math/tex" id="MathJax-Element-47">{\bf{z}}</script>表示待检测样本，

x<script type="math/tex" id="MathJax-Element-48">{\bf{x}}</script>表示训练样本，

F∗(x)⊙F(z)<script type="math/tex" id="MathJax-Element-49">{{\cal F}^ * }({\bf{x}}) \odot {\cal F}({\bf{z}})</script>项在信号处理领域称为互相关（cross-correlation），

kxz<script type="math/tex" id="MathJax-Element-50">{{\bf{k}}^{{\bf{xz}}}}</script>表示

x<script type="math/tex" id="MathJax-Element-51">{\bf{x}}</script>与

z<script type="math/tex" id="MathJax-Element-52">{\bf{z}}</script>的互相关核，一般在样本

z<script type="math/tex" id="MathJax-Element-53">{\bf{z}}</script>的检测阶段采用，而在样本的训练阶段，如式(10)所示，则取样本

x<script type="math/tex" id="MathJax-Element-54">{\bf{x}}</script>的自相关核，即

kxx<script type="math/tex" id="MathJax-Element-55">{{\bf{k}}^{{\bf{xx}}}}</script>形式。此处为避免样本的混淆，统一采用

kxz<script type="math/tex" id="MathJax-Element-56">{{\bf{k}}^{{\bf{xz}}}}</script>表示核向量。

2.多项式核函数

⎧ ⎩ ⎨ k x z = κ (x, z) = (x T z + a) b F (k x z) = (F * (x) ⊙ F (z) + a) b (12)

3.径向基核函数

径向基核函数形式为kxz=κ(x,z)=h(∥x−z∥2)<script type="math/tex" id="MathJax-Element-58">{{\bf{k}}^{{\bf{xz}}}} = \kappa ({\bf{x}},{\bf{z}}) = h\left( {{{\left\| {{\bf{x}} - {\bf{z}}} \right\|}^2}} \right)</script>，通常使用高斯核函数代替

⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ k x z = κ (x, z) = exp (- 1 σ 2 (∥ x ∥ 2 + ∥ z ∥ 2 - 2 x T z)) F (k x z) = F (exp (- 1 σ 2 (∥ x ∥ 2 + ∥ z ∥ 2 - 2 F - 1 (F * (x) ⊙ F (z))))) (13)

考虑使用线性核函数的情况，将其代入式（10）得：

F (α) = F ( y ) F ( x ) ⊙ F * ( x ) + λ

α<script type="math/tex" id="MathJax-Element-61">{\bf{\alpha }}</script>是

w<script type="math/tex" id="MathJax-Element-62">{\bf{w}}</script>在对偶空间的表示，二者存在以下关系：

w = \sum i = 1 N α i φ (x i) = \sum i = 1 N α i x i = X T α

w<script type="math/tex" id="MathJax-Element-64">{\bf{w}}</script>展开得：

w = (F \cdot d i a g (F (x)) \cdot F H) T \cdot α = F \cdot d i a g (F * (x)) \cdot F H \cdot α

F (w) = (F * (x)) * ⊙ F (α) = F ( x ) ⊙ F ( y ) F ( x ) ⊙ F * ( x ) + λ

快速检测

在样本检测阶段，每个样本的回归值由下式唯一确定：

f (z) = (K x z) T α (14)

α<script type="math/tex" id="MathJax-Element-68">{\bf{\alpha }}</script>为由

x<script type="math/tex" id="MathJax-Element-69">{\bf{x}}</script>的自相关核

kxx<script type="math/tex" id="MathJax-Element-70">{{\bf{k}}^{{\bf{xx}}}}</script>训练出来的在希尔伯特空间的分类面，

Kxz<script type="math/tex" id="MathJax-Element-71">{{\bf{K}}^{{\bf{xz}}}}</script>为由

x<script type="math/tex" id="MathJax-Element-72">{\bf{x}}</script>与

z<script type="math/tex" id="MathJax-Element-73">{\bf{z}}</script>的互相关核

kxz<script type="math/tex" id="MathJax-Element-74">{{\bf{k}}^{{\bf{xz}}}}</script>生成的循环矩阵。

f(z)<script type="math/tex" id="MathJax-Element-75">f({\bf{z}})</script>包含了基础样本每一个循环移位情况对应的相关值，该响应中最大值位置即为当前检测样本与训练样本最相似的位置。同样，为实现高速计算，将式（14）转换到频域空间，对其化简得：

f (z) = (F \cdot d i a g (F (k x z)) \cdot F H) T \cdot α = F \cdot d i a g (F * (k x z)) \cdot F H \cdot α = F - 1 ((F * (k x z)) * ⊙ F (α)) = F - 1 (F (k x z) ⊙ F (α)) (15)

O(n2)<script type="math/tex" id="MathJax-Element-77">O({n^2})</script>降为

O(nlogn)<script type="math/tex" id="MathJax-Element-78">O(n\log n)</script>。

相关滤波在二维样本上的推广

前文对相关滤波原理的研究与推导仅仅局限于一维样本的情况，而实际应用中，对图像样本进行回归分类尤为常见，故非常有必要将相关滤波算法推广到二维样本的情况。
对于图像，一维样本特指图像的一行像素，二维样本则指整个图像。对于长度为N的一维样本在行方向上的循环位移构成N×N的循环矩阵，其可视化形式如下图所示。
这里写图片描述
对于M×N的二维样本，其原本就是矩阵，需要在行和列两个方向上分别进行循环位移，其广义循环矩阵其实是M2×N2<script type="math/tex" id="MathJax-Element-289">M^2 \times N^2</script>的矩阵，其可视化形式如下图所示，

为方便宏观上观察，目标图像每次位移固定的像素数，图中(0,0)号示样表示原始样本。
然而，通过研究上文中一维样本的相关滤波原理，可以发现：虽然在原理的推导过程中，一维样本需要转化为循环矩阵，然而在该算法的最终原理公式中，如式（10）~（13）、（15）所示，并没有涉及该样本的循环矩阵形式，所有参与计算的变量仍然是样本的基础形态，此过程中起着重要作用的部分就是DFT。

DFT有两个重要性质分别是“周期性”与“平移性”，一维样本的循环位移相当于在时域内对样本进行了周期扩展与位移，由该样本生成的循环矩阵的每一行元素的频谱都具有完全一致的功率谱，而且该特性同样适用于二维样本，其表现形式如下图所示。
这里写图片描述
实际上，DFT本身就已经隐式的对样本进行了循环位移的操作。而FFT不仅大大降低了算法的时间复杂度，而且通过对原始样本的变换，使得相关滤波器在频域中包含了样本形态的“无限可能”，也使得相关滤波算法很容易的推广到二维样本。

此处仅选取式（10）、（13）、（15）这三个核心公式进行推广，其中为表述简洁方便，用上标(^)<script type="math/tex" id="MathJax-Element-290">{\rm{\hat() }}</script>表示该元素的傅立叶变换，如X^=F(X)<script type="math/tex" id="MathJax-Element-291">{\bf{\hat X}} = {\cal F}\left( {\bf{X}} \right)</script>。式（10）可重新表示为