《计算机视觉》习题解答（三）第4章

文章目录习题解答4.14.2习题解答答案仅供参考\color{red}{答案仅供参考}答案仅供参考4.1μ^,σ^2=argmaxμ,σ2[∑i=1Ilog[Normxi[μ,σ2]]]=argmaxμ,σ2[−0.5Ilog[2π]−0.5Ilogσ2−0.5∑i=1I(xi−μ)2σ2]\begin{aligned}\hat\mu,\hat\sigma^2& = ...

随机ID

6324人浏览 · 2019-09-16 18:48:54

随机ID · 2019-09-16 18:48:54 发布

文章目录

- 习题解答
- - - 4.1
    - 4.2
    - 4.3
    - 4.4
    - 4.5
    - 4.6
    - 4.7
    - 4.8
    - 4.9
    - 4.10

习题解答

$\color{red}{答案仅供参考}$

4.1

$\begin{aligned} \hat\mu,\hat\sigma^2 & = \underset{\mu,\sigma^2}{\text{argmax}} \left[ \sum_{i=1}^I \text{log} \left[ \text{Norm}_{x_i} [\mu,\sigma^2]\right] \right] \\ & = \underset{\mu,\sigma^2}{\text{argmax}} \left[ -0.5I\text{log}[2\pi]-0.5I\text{log}\sigma^2-0.5\sum_{i=1}^I \frac{(x_i-\mu)^2}{\sigma^2} \right] \end{aligned}$
$求似然对数L对\sigma^2的微分，并令结果为0$
$\begin{aligned} \frac{\partial L}{\partial \sigma^2} & = -0.5I \frac{1}{\sigma^2}+0.5 \sum_{i=1}^I \frac{(x_i-\mu)^2}{\sigma^4}=0 \end{aligned}$
$整理得到$
$\hat{\sigma}^2=\sum_{i=1}^I \frac{(x_i-\hat\mu)^2}{I}$
$得证$

4.2

$\begin{aligned} \hat\mu,\hat\sigma^2 & = \underset{\mu,\sigma^2}{\text{argmax}} \left[ \sum_{i=1}^I \text{log} \left[ \text{Norm}_{x_i} [\mu,\sigma^2]\right] + \text{log} [\text{NormInvGam}_{\mu,\sigma^2}[\alpha,\beta,\gamma,\delta]] \right] \\ & = \underset{\mu,\sigma^2}{\text{argmax}} \left[ -0.5I\text{log}[2\pi]-0.5I\text{log}\sigma^2-0.5\sum_{i=1}^I \frac{(x_i-\mu)^2}{\sigma^2} + \text{log} \left[ \frac{\sqrt\gamma \beta^{\alpha}}{\sqrt{2\pi}\Gamma[\alpha]} \right] -(\alpha+1.5)\text{log}[\sigma^2]-\frac{2\beta+\gamma(\delta-\mu)^2}{2\sigma^2} \right] \end{aligned}$
$求似然对数L对\mu的微分，并令结果为0$
$\begin{aligned} \frac{\partial L}{\partial \mu} & = \sum_{i=1}^I\frac{x_i-\mu}{\sigma^2}+\frac{\gamma(\delta-\mu)}{\sigma^2} \\ & =\frac{\sum_{i=1}^I x_i -I\mu+\gamma\delta-\gamma\mu}{\sigma^2} \\ & = 0 \end{aligned}$
$整理得到$
$\hat{\mu}=\frac{\sum_{i=1}^I x_i+\gamma\delta}{I+\gamma}$
$同理求似然对数L对\sigma^2的微分，并令结果为0$
$\begin{aligned} \frac{\partial L}{\partial \sigma^2} & = - \frac{I}{2\sigma^2}+\frac{\sum (x_i-\mu)^2}{2\sigma^4} - \frac{2\alpha+3}{2\sigma^2}+\frac{2\beta+\gamma(\delta-\mu)^2}{2\sigma^4} \\ & = \frac{\sum(x_i-\mu)^2+2\beta+\gamma(\delta-\mu)^2}{2\sigma^4}-\frac{I+3+2\alpha}{2\sigma^2} \\ & = 0 \end{aligned}$
$整理得到$
$\hat{\sigma^2}=\frac{\sum_{i=1}^I(x_i-\mu)^2+2\beta+\gamma(\delta-\mu)^2}{I+3+2\alpha}$

4.3

$已知$
$L=\sum_{k=1}^6N_k\text{log}[\lambda_k]+\nu\left( \sum_{k=1}^6\lambda_k-1 \right)$
$求似然对数L对\lambda_k的微分，并令结果为0$
$\begin{aligned} \frac{\partial L}{\partial \lambda_k} & = \frac{N_k}{\lambda_k}+\nu \\ & = 0 \end{aligned}$
$整理得到$
$\hat{\lambda_k}=\frac{N_k}{-\nu}$
$又因为$
$\sum_{k=1}^6 \lambda_k=1$
$所以$
$-\nu=\sum_{m=1}^6N_m$
$综上$
$\hat{\lambda_k}=\frac{N_k}{\sum_{m=1}^6N_m}$
$得证$

4.4

$已知$
$\begin{aligned} \hat{\lambda}_{1\cdots6} & =\underset{\lambda_{1\cdots6}} {\text{argmax}} \left[ \prod_{i=1}^I Pr(x_i|\lambda_{1\cdots6})Pr(\lambda_{1\cdots6}) \right] \\ & =\underset{\lambda_{1\cdots6}} {\text{argmax}} \left[ \prod_{i=1}^I \text{Cat}_{x_i}[\lambda_{1\cdots6}] \text{Dir}_{\lambda_{1\cdots6}}[\alpha_{1\cdots6}] \right] \\ & = \underset{\lambda_{1\cdots6}} {\text{argmax}} \left[ \prod_{k=1}^6\lambda_k^{N_k}\cdot(与\lambda_k 无关的量)\cdot \prod_{k=1}^6 \lambda_k^{\alpha_k-1} \right] \\ & = \underset{\lambda_{1\cdots6}} {\text{argmax}} \left[ \prod_{k=1}^6 \lambda_k^{N_k+\alpha_k-1} \right] \end{aligned}$
$通过拉格朗日因子增强约束，似然对数为$
$L=\sum_{k=1}^6(N_k+\alpha_k-1) \text{log}[\lambda_k]+\nu(\sum_{k=1}^6\lambda_k-1)$
$求似然对数L对\lambda_k的微分，并令结果为0$
$\begin{aligned} \frac{\partial L}{\partial \lambda_k} & = \frac{N_k+\alpha_k-1}{\lambda_k}+\nu \\ & = 0 \end{aligned}$
$整理得到$
$\hat{\lambda_k}=\frac{N_k+\alpha_k-1}{-\nu}$
$又因为$
$\sum_{k=1}^6 \lambda_k=1$
$所以$
$-\nu=\sum_{m=1}^6(N_m+\alpha_m-1)$
$综上$
$\hat{\lambda_k}=\frac{N_k+\alpha_k-1}{\sum_{m=1}^6(N_m+\alpha_m-1)}$
$得证$

4.5

$(i)$
$\begin{aligned} Pr(x_{1\cdots I}) & = \int\prod_{i=1}^I Pr(x_i|\theta)Pr(\theta) \text d\theta \\ & = \iint \prod_{i=1}^I \text{Norm}_{x_i}[\mu,\sigma^2] \cdot \text{NormInvGam}_{\mu,\sigma^2}[\alpha,\beta.\gamma,\delta]\text d\mu \text d\sigma^2 \\ & = \iint \kappa \cdot\text{NormInvGam}_{\mu,\sigma^2}[\widetilde\alpha,\widetilde\beta,\widetilde\gamma,\widetilde\delta]\text d\mu \text d\sigma^2 \\ & = \kappa=balabala \end{aligned}$

$(i i)$
$\begin{aligned} Pr(x_{1\cdots I}) & = \int\prod_{i=1}^I Pr(x_i|\theta)Pr(\theta) \text d\theta \\ & = \int \prod_{i=1}^I \text{Cat}_{x_i}[\lambda_{1\cdots I}] \cdot \text{Dir}_{\lambda_{1\cdots I}}[\alpha_{1\cdots I}] \text d\lambda_{1\cdots I} \\ & = \int \kappa \cdot\text{Dir}_{\lambda_{1\cdots I}}[\widetilde\alpha_{1\cdots I}] \text d\lambda_{1\cdots I} \\ & = \kappa=balabala \end{aligned}$

4.6

$\color{red}{ToDo}$

4.7

$\begin{aligned} \hat\lambda & = \underset{\lambda}{\text{argmax}} \left[ \sum_{i=1}^I \text{log} \left[ \text{Bern}_{x_i} [\lambda]\right] \right] \\ & = \underset{\lambda}{\text{argmax}} \left[\left(\sum_{i=1}^I x_i \right) \text{log}[\lambda] +\left(\sum_{i=1}^I 1-x_i \right) \text{log}[1-\lambda] \right] \end{aligned}$
$求似然对数L对\lambda的微分，并令结果为0$
$\begin{aligned} \frac{\partial L}{\partial \lambda} & =\frac{ \sum_{i=1}^Ix_i}{\lambda}-\frac{ \sum_{i=1}^I 1-x_i}{1-\lambda} \\ & = 0 \end{aligned}$
$整理得到$
$\hat{\lambda}=\frac{\sum_{i=1}^I x_i}{I}$

4.8

$\begin{aligned} \hat{\lambda} & =\underset{\lambda} {\text{argmax}} \left[ \text{log} \left[\frac{ \prod_{i=1}^I Pr(x_i|\lambda)Pr(\lambda)}{Pr(x_{1\cdots I})} \right] \right] \\ & =\underset{\lambda} {\text{argmax}} \left[ \text{log} \left[\prod_{i=1}^I Pr(x_i|\lambda)Pr(\lambda)\right] \right] \\ & =\underset{\lambda} {\text{argmax}} \left[\sum_{i=1}^I \text{log} \left[ \text{Bern}_{x_i} [\lambda]\right]+ \text{log} [\text{Beta}_{\lambda} [\alpha,\beta] ]\right] \\ & = \underset{\lambda}{\text{argmax}} \left[\left(\sum_{i=1}^I x_i \right) \text{log}[\lambda] +\left(\sum_{i=1}^I 1-x_i \right) \text{log}[1-\lambda] +(\alpha-1) \text{log}[\lambda]+(\beta-1) \text{log}[1-\lambda] \right] \end{aligned}$

$求似然对数L对\lambda的微分，并令结果为0$
$\begin{aligned} \frac{\partial L}{\partial \lambda} & =\frac{ \sum_{i=1}^Ix_i}{\lambda}-\frac{ \sum_{i=1}^I 1-x_i}{1-\lambda} +\frac{\alpha-1}{\lambda} -\frac{\beta-1}{1-\lambda}\\ & = 0 \end{aligned}$
$整理得到$
$\hat{\lambda}=\frac{\sum_{i=1}^I x_i+\alpha-1}{I+\alpha+\beta-2}$

4.9

(i)
$\begin{aligned} Pr(\lambda|x_{1\cdots I}) & = \frac{Pr(x_{1\cdots I}|\lambda) Pr(\lambda) }{Pr(x_{1 \cdots I})} \\ & =\frac{\prod_{i=1}^I \text{Bern}_{x_i}[\lambda]\cdot \text{Beta}_{\lambda}[\alpha,\beta]} {Pr(x_{1 \cdots I})} \\ & =\frac{\kappa \cdot \text{Beta}_{\lambda}[\widetilde\alpha,\widetilde\beta]} {Pr(x_{1 \cdots I})} \\ & = \text{Beta}_{\lambda}[\widetilde\alpha,\widetilde\beta] \end{aligned}$

(ii)
$\begin{aligned} Pr(x^*|x_{1\cdots I}) & = \int Pr(x^*|\lambda)Pr(\lambda|x_{1\cdots I}) \text d\lambda \\ & = \int \text{Bern}_{x^*}[\lambda]\cdot \text{Beta}_{\lambda}[\widetilde\alpha,\widetilde\beta] d\lambda \\ & = \int \kappa(x^*,\widetilde\alpha,\widetilde\beta) \text{Beta}_{\lambda} [\breve\alpha,\breve\beta] d\lambda \\ & = \kappa(x^*,\widetilde\alpha,\widetilde\beta) \end{aligned}$

4.10

$方法与上面一致，过程略去$
(i)
$\hat\lambda=\frac{\sum x_i}{I}=0$
$计算Pr(x^*|\hat\lambda)$

(ii)
$\hat{\lambda}=\frac{\sum_{i=1}^I x_i+\alpha-1}{I+\alpha+\beta-2}=0$
$计算Pr(x^*|\hat\lambda)$
(iii)
$计算Pr(x^*|x_{1\cdots 4})= \kappa(x^*,\widetilde\alpha,\widetilde\beta)$