极大似然估计求解多项式分布参数

原因今天晚上，老师在看LDA数学八卦的时候，问我一个问题，如下图所示：这个多项式分布的参数，采用极大估计是怎么求的呢?当时想了想还真不知道，于是在网上找了资料，学习了一下，特此记录。公式推导很多情况下，假定一个变量XX有kk个状态，其中k>2k>2,每个状态假定的可能性为p1,p2,⋯,pkp_{1},p_{2},\cdots ,p_{k}，且∑ki=1pi=1\sum

HFUT_qianyang

13706人浏览 · 2018-05-07 22:16:46

HFUT_qianyang · 2018-05-07 22:16:46 发布

本文作者：合肥工业大学管理学院钱洋 email：1563178220@qq.com 内容可能有不到之处，欢迎交流。

未经本人允许禁止转载。
#原因
今天晚上，老师在看LDA数学八卦的时候，问我一个问题，如下图所示：

这里写图片描述

这个多项式分布的参数，采用极大估计是怎么求的呢?当时想了想还真不知道，于是在网上找了资料，学习了一下，特此记录。

#公式推导
很多情况下，假定一个变量 $X$ 有 $k$ 个状态，其中 $k > 2$ ,每个状态假定的可能性为 $p1,p2,⋯ ,pkp_{1},p_{2},\cdots ,p_{k}$ ，且 $∑i=1kpi=1\sum _{i=1}^{k}p_{i}=1$ ,独立进行 $n$ 次实验，用 $n1,n2,⋯ ,nkn_{1},n_{2},\cdots ,n_{k}$ 表示每个状态发生的次数，发生的次数服从多项式分布：
$p(n1,n2,⋯ ,nk∣p1,p2,⋯ ,pk)=n!∏i=1kni!∏i=1kpinip\left ( n_{1},n_{2},\cdots ,n_{k}|p_{1},p_{2},\cdots ,p_{k} \right )=\frac{n!}{\prod _{i=1}^{k}n_{i}!}\prod _{i=1}^{k}p_{i}^{n_{i}}$

下面采用极大似然求解：

$L(p1,p2,⋯ ,pk)=log(n!∏i=1kni!∏i=1kpini)L\left ( p_{1},p_{2},\cdots ,p_{k} \right )=log\left (\frac{n!}{\prod _{i=1}^{k}n_{i}!}\prod _{i=1}^{k}p_{i}^{n_{i}} \right )$
$=log(n!)−∑i=1klognk!+∑i=1klogpk=log\left ( n! \right )-\sum _{i=1}^{k}logn_{k}!+\sum _{i=1}^{k}logp_{k}$

对于有约束条件的极值求解问题可使用拉格朗日乘法：
$Lagrange\left ( p_{1},p_{2},\cdots ,p_{k},\lambda \right )=L\left ( p_{1},p_{2},\cdots ,p_{k} \right )-\lambda\left ( \sum _{i=1}^{k}p_{i}-1 \right )$

求导(计算梯度)：
$∂Lagrange(p1,p2,⋯ ,pk,λ)∂pi=nipi−λ\frac{\partial Lagrange\left ( p_{1},p_{2},\cdots ,p_{k},\lambda \right )}{\partial p_{i}}=\frac{n_{i}}{p_{i} }-\lambda$

进而有：
$pi=niλp_{i}=\frac{n_{i}}{\lambda }$

由于
$∑i=1kniλ=1\sum _{i=1}^{k}\frac{n_{i}}{\lambda }=1$

得到：
$λ=n\lambda=n$

进而有：
$pi^=nin\hat{p_{i}}=\frac{n_{i}}{n}$

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI Agent 的时间序列预测模块LSTM 与 Transformer 的混合建模【附代码】

2048 AI社区

基本数据类型

main后面圆括号内的 void表示它没有函数参数,main前面的im表示函数执行后会返回操作系统一个整型值,在man函数的函数体中的最后一条语句使用retum语句返回了这个值,通常返回0表示程序正常结束。变量名是用户定义的标识符(Identiier),用于标识内存中一个具体的存储单元,在这个存储单元中存放的数据称为变量的值。变量的类型决定了编译器为其分配内存单元的字节数、数据在内存单元中的存放形

2048 AI社区

Java 开发者必看：JBoltAI 如何降低 AI 应用开发门槛？

同时，JBoltAI内置私有化数据训练服务（RAG），结合Bge、百川、llama3等主流Embedding模型和腾讯、百度、Milvus等向量数据库，开发者无需深入研究自然语言处理技术，就能快速构建专属的私有知识库。无论是新开发的AI原生应用，还是对老系统的AI化升级，都能无缝衔接现有Java业务逻辑，让开发者在熟悉的技术生态中快速实现AI功能落地。对于新开发的系统，JBoltAI则提供了从底层