朴素贝叶斯:后验概率最大化的推导

朴素贝叶斯最大化后验概率的推导

liu7418520963

1003人浏览 · 2024-07-22 16:45:14

liu7418520963 · 2024-07-22 16:45:14 发布

本文是记录在学习朴素贝叶斯的后验概率最大化的推导遇到的一些疑问, 以供参考.

首先, 我们可以知道朴素贝叶斯分类器可以表示为:
$y=f(x)=\arg\max_{c_k}P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)$
假设损失函数为: $L (Y, f (X))$ , 所以期望损失函数为:
$\begin{aligned} R_{exp}f(x)&= E(L(Y, f(X)) \\ &= \sum_{x\in X}\sum_{c_k \in Y} L(y=c_k, f(x)) P(X=x, Y=c_k) \\ &= \sum_{x\in X}\sum_{c_k \in Y} L(y=c_k, f(x)) P(Y=c_k|X=x) P(X=x) \\ &= \sum_{x\in X}\bigg[\sum_{c_k \in Y} L(y=c_k, f(X)) P(Y=c_k|X=x)\bigg] P(X=x) \\ &= E_X\bigg[\sum_{c_k \in Y} L(y=c_k, f(X)) P(Y=c_k|X=x)\bigg] \end{aligned}$
当损失函数是 0-1 损失函数
$\left\{ \begin{array}{cc} 1, & Y \neq f(X) \\ 0, & Y = f(X) \end{array} \right.$

若预测值 $f (x) = y$ , 期望损失函数为 $E (0) = 0$ ;

若预测值 $)\neq y$ , 期望损失函数为 $E_X\bigg[\sum_{c_k \in Y} P(y \neq c_k|X=x)\bigg]$

所以最小化期望损失函数就是:
$=\arg\min_{c_k}E_X\bigg[\sum_{c_k \in Y} P(y \neq c_k|X=x)\bigg]$
因为 $P (x)$ 是概率密度函数, 相当于 $\sum_{c_k \in Y} P(y \neq c_k|X=x)$ 这一部分的权重,
所以最小化 $E_X\bigg[\sum_{c_k \in Y} P(y \neq c_k|X=x)\bigg])$ 就相当于对每个 $x$ 求最小化
所以有:

$=\arg\min_{c_k}\sum_{c_k \in Y} P(y \neq c_k|X=x)$

这里的预测值 $x$ 只会属于某一个类别，因此，1减去属于某个类别的概率等价于预测值不属于其他所有类别的概率, 就可以去掉求和符 $\sum_{c_k \in Y}$ , 得到:
$\begin{aligned} f(x)&=\arg\min_{c_k}(1- P(y \neq c_k|X=x)) \\ &=\arg \max_{c_k}P(y = c_k|X=x) \end{aligned}$