一、欧氏距离(Euclidean Distance)

欧氏距离是最常见的距离度量之一,用于计算两个点之间的直线距离。

公式:

对于二维空间中的两个点   P ( x 1 , y 1 ) \ P(x_1, y_1)  P(x1,y1)   Q ( x 2 , y 2 ) \ Q(x_2, y_2)  Q(x2,y2)

d ( P , Q ) = ( x 2 − x 1 ) 2 + ( y 2 − y 1 ) 2 d(P, Q) = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2} d(P,Q)=(x2x1)2+(y2y1)2

  n \ n  n 维空间中(   P n ( x 1 , x 2 , . . . , x n ) \ P_n(x_1,x_2,...,x_n)  Pn(x1,x2,...,xn);   Q n ( y 1 , y 2 , . . . , y n ) \ Q_n(y_1,y_2,...,y_n)  Qn(y1,y2,...,yn)),计算公式为:
d ( P , Q ) = ∑ i = 1 n ( x i − y i ) 2 d(P, Q) = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2} d(P,Q)=i=1n(xiyi)2
在这里插入图片描述
注意是n维,而不是n个点,就是我们从初中到高中经常用到的距离公式!

原理:

  • 计算两点间的直线最短路径
  • 适用于几何计算机器学习中的距离计算。

二、曼哈顿距离(Manhattan Distance)

曼哈顿距离度量的是沿坐标轴方向的距离,而非直线距离。

公式:

对于二维空间中的两个点   P ( x 1 , y 1 ) \ P(x_1, y_1)  P(x1,y1)   Q ( x 2 , y 2 ) \ Q(x_2, y_2)  Q(x2,y2)

d ( P , Q ) = ∣ x 2 − x 1 ∣ + ∣ y 2 − y 1 ∣ d(P, Q) = |x_2 - x_1| + |y_2 - y_1| d(P,Q)=x2x1+y2y1

  n \ n  n 维空间中,公式为:

d ( P , Q ) = ∑ i = 1 n ∣ x i − y i ∣ d(P, Q) = \sum_{i=1}^{n} |x_i - y_i| d(P,Q)=i=1nxiyi

原理:

  • 适用于网格状城市(如曼哈顿街道)。
  • 仅允许水平或垂直方向的移动。
    在这里插入图片描述

三、切比雪夫距离(Chebyshev Distance)

切比雪夫距离计算的是最大坐标轴差异,适用于棋盘格场景。

公式:

对于二维空间中的两个点   P ( x 1 , y 1 ) \ P(x_1, y_1)  P(x1,y1)   Q ( x 2 , y 2 ) \ Q(x_2, y_2)  Q(x2,y2)

d ( P , Q ) = max ⁡ ( ∣ x 2 − x 1 ∣ , ∣ y 2 − y 1 ∣ ) d(P, Q) = \max(|x_2 - x_1|, |y_2 - y_1|) d(P,Q)=max(x2x1,y2y1)

  n \ n  n 维空间中,公式为:

d ( P , Q ) = max ⁡ i = 1 n ∣ x i − y i ∣ d(P, Q) = \max_{i=1}^n |x_i - y_i| d(P,Q)=i=1maxnxiyi

原理:

  • 适用于国际象棋中的国王移动(八个方向)。
  • 计算最短步数时较为常见。

四、闵可夫斯基距离(Minkowski Distance)

闵可夫斯基距离是欧氏距离和曼哈顿距离的广义形式,通过调整参数   p \ p  p 来控制计算方式。

公式:

对于   n \ n  n 维空间中的两个点:

d ( P , Q ) = ( ∑ i = 1 n ∣ x i − y i ∣ p ) 1 p d(P, Q) = \left( \sum_{i=1}^{n} |x_i - y_i|^p \right)^{\frac{1}{p}} d(P,Q)=(i=1nxiyip)p1

  •   p = 1 \ p = 1  p=1 时,闵可夫斯基距离等于曼哈顿距离
  •   p = 2 \ p = 2  p=2 时,闵可夫斯基距离等于欧氏距离

原理:

  • 适用于灵活调整不同计算方式的场景。
  • 通过改变   p \ p  p 值,可适配不同任务。

五、马氏距离(Mahalanobis Distance)

马氏距离是一种考虑数据分布的距离度量方式,它不仅计算点之间的距离,还考虑变量的协方差关系

公式:

对于两个点   P \ P  P   Q \ Q  Q,马氏距离定义为:

d ( P , Q ) = ( P − Q ) T Σ − 1 ( P − Q ) d(P, Q) = \sqrt{(P - Q)^T \Sigma^{-1} (P - Q)} d(P,Q)=(PQ)TΣ1(PQ)

其中:

  •   Σ − 1 \ \Sigma^{-1}  Σ1 为数据的协方差矩阵的逆

原理:

  • 适用于多维数据分析,考虑特征之间的相关性。
  • 常用于异常检测和**主成分分析(PCA)**等领域。

不同的距离度量方法适用于不同的任务场景,选择合适的距离计算方式能提高算法的效果!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐