隐马尔可夫模型之Baum-Welch算法详解

隐马尔可夫模型之Baum-Welch算法详解在上篇博文中，我们学习了隐马尔可夫模型的概率计算问题和预测问题，但正当要准备理解学习问题时，发现学习问题中需要EM算法的相关知识，因此，上一周转而学习了EM算法和极大似然估计，对隐藏变量的求解有了一些自己的理解，现在我们继续回过头来学习隐马尔可夫模型的学习问题。

Demon的黑与白

74199人浏览 · 2016-11-05 18:03:12

Demon的黑与白 · 2016-11-05 18:03:12 发布

隐马尔可夫模型之Baum-Welch算法详解

前言

在上篇博文中，我们学习了隐马尔可夫模型的概率计算问题和预测问题，但正当要准备理解学习问题时，发现学习问题中需要EM算法的相关知识，因此，上一周转而学习了EM算法和极大似然估计，对隐藏变量的求解有了一些自己的理解，现在我们继续回过头来学习隐马尔可夫模型的学习问题。EM算法的相关介绍可参照博文 EM算法及其推广学习笔记。如果对隐马尔可夫模型还不胜了解的话，可参看博文隐马尔可夫学习笔记（一）。

学习问题

隐马尔可夫模型的学习，根据训练数据是包括观测序列和对应的状态序列还是只有观测序列，可以分别由监督学习与非监督学习实现。本节首先介绍监督学习算法，而后介绍非监督学习算法——Baum-Welch算法（也就是EM算法）。

监督学习问题

假设已给训练数据包含S个长度相同的观测序列和对应的状态序列 {(O1,I1),(O2,I2),...,(OS,IS)} <script type="math/tex" id="MathJax-Element-1">\{(O_1,I_1),(O_2,I_2),...,(O_S,I_S)\}</script>，那么可以利用极大似然估计方法来估计隐马尔可夫模型的参数，具体方法如下。

1.转移概率 aij <script type="math/tex" id="MathJax-Element-2">a_{ij}</script>的估计
设样本中时刻t处于状态i时刻t+1转移到j的频数为 Aij <script type="math/tex" id="MathJax-Element-3">A_{ij}</script>，那么状态转移概率为 aij <script type="math/tex" id="MathJax-Element-4">a_{ij}</script>的估计是

a^i j = A i j \sum N j = 1 A i j, i = 1, 2, . . ., N, j = 1, 2, . . ., N

a1,a2,a3 <script type="math/tex" id="MathJax-Element-6">a_1,a_2,a_3</script>，那么

asunny−>any state=[a1a1+a2+a3,a2a1+a2+a3,a3a1+a2+a3] <script type="math/tex" id="MathJax-Element-7">a_{sunny - > any \space state} =[\frac {a_1}{a_1+a_2+a_3},\frac {a_2}{a_1+a_2+a_3},\frac {a_3}{a_1+a_2+a_3}]</script>。因此，状态转移矩阵可以根据给定的隐藏序列

I <script type="math/tex" id="MathJax-Element-8">I</script>计算得出。

2.观测概率bj(k)<script type="math/tex" id="MathJax-Element-9">b_j(k)</script>的估计
设样本中状态为j并观测为k的频数是 Bjk <script type="math/tex" id="MathJax-Element-10">B_{jk}</script>，那么状态为j观测为k的概率 bj(k) <script type="math/tex" id="MathJax-Element-11">b_j(k)</script>的估计是

b^j (k) = B j k \sum M k = 1 B j k, j = 1, 2, . . ., N; k = 1, 2, . . ., M

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

硬核多语言办公方案：基于Gemini境像站的实时翻译与双语文档自动化生成管道（国内免费镜像实测）

将Gemini嵌入到日常的多语言办公场景中，不仅能消除语言障碍，还能通过术语控制和格式保持，确保输出内容的专业性和一致性。从邮件双语对照到文档本地化初稿，再到结构化会议纪要，这条翻译管道能显著降低跨国协作的沟通摩擦。如果你想在自己的团队中尝试这套方案，可以访问RskAi，无需任何网络配置，国内打开就能用。利用目前的免费额度，将文中的指令模板替换为你们的真实沟通内容，体验一下“一键双语输出”的高效与

2048 AI社区

ops-transformer 是什么：五句话让一个完全不懂的人听明白

我有个朋友是做后端的老程序员，最近想转大模型训练方向，跟我说想了解一下昇腾 NPU 的算子生态。他对 PyTorch 熟悉，但没接触过 CANN，问了我一个问题：“ops-transformer 这个仓库到底解决了什么问题？我给他讲了大概二十分钟，最后他跟我说："你能不能用五句话概括？"我试了一下，发现做不到——因为这个仓库解决的不是一个问题，而是串联起了一整条链路上的多个问题。但我可以换一种方式