就目前国内而言,大多数学者专家都注重对隐马氏过程的实用价值进行研究,其中刘河 生等学者在《隐马尔可夫模型的原理与实现》一文中在阐述了 HMM 的概况后,将模型特性用 参数集合的形式来表示为[转移概率 A,观察概率 B,初始状态概率 π],并说明 HMM 研究中 出现的三类问题以及基本解法。从理论上分析 HMM 过程的算法过程以及适用情况。彭丽莉学 者在其硕士学位论文《关于模式识别中的 HMM 模型的探究》中,对 HMM 做出了详细的阐述, 具体包括一阶马尔可夫模型、一阶隐马尔可夫模型以及三类问题,另外还说明了一阶 HMM 的 算法与基于熵模型的 HMM 模型,最后阐述了混合隐马尔可夫模型问题与算法。其次,中科院 计算技术研究所的王实等学者在发表的文章中对隐马尔可夫模型进行了实际应用,他们将 HMM 应用于 Web 挖掘中的用户迁移模式的发现。为了配合实验,重新定义了带有兴趣的隐马 尔可夫模型,通过数据实验后与马尔科夫模型进行了比较来说明 HMM 的实用性。后面的参考 文献中,学者们都在阐述 HMM 基本原理后,将其应用到自己的研究领域中,并呈现出显著的 效果,例如程序异常行为检测、人脸表情识别、音频自动分类、人脸检测、文本信息抽取等 等诸多领域。
从已有成果来看,国内外专家学者对于隐马尔可夫模型的应用研究非常深入,并且在不 断探索其在新领域中的应用价值以及理论上的发展。现有研究成果涉及范围广泛,对于模型 的讲解也各有侧重点,也对模型有不同方向的拓展。基本上的文献资料所面向的读者都需要 具备一定程度的理论知识基础,专业针对性较强,对于一般读者来说会有一定的阅读困难, 难以达到传播知识的要求,虽然网络上都有科普性的文章,但是并没有相对系统的总结,也 缺乏专业性。因此,针对该统计模型在科普与专业上的矛盾,本人欲在阐述 HMM 的基本原理 的同时,利用通俗易懂的实际例子来说明 HMM,在达到科普的同时,进一步分析 HMM 的三类 基本问题以及理论算法,其后再借助 MATLAB 软件对客户分类问题进行建模说明 HMM 的极高 的实用价值,提高文章的专业性,将简单例子与专业统计软件相结合来达到阐释 HMM。
2。 隐马尔可夫模型
2。1 马尔可夫链
马尔可夫过程 (Markov Process),它由俄罗斯数学家安德烈·马尔可夫发现,代表数 学中具有马尔可夫性质的离散随机过程。形式定义如下:
定义 1:设t , t T是一族随机变量, T 是一个实数集合,若对任意实数 t T ,
t 是一个随机变量,则称t , t T为随机过程。 文献综述
【 T 称为参数集合,参数t 可以看作时间。t 的每一个可能取值称为随机过程的一个状
态。其全体可能取值所构成的集合称为状态空间,记作 E 。当参数集合 T 为非负整数集时, 随机过程又称随机序列。马尔可夫链就是一类特殊的随机序列。】
定义 2: 设n , n 1, 2,是一个随机序列,状态空间 E 为有限或可列集,对于任意 的正整数 m , n ,若i , j , ik E k 1,n 1,有
则称n , n 1, 2,为一个马尔可夫链(简称马氏链)。 通过上述两个定义,我们可以知道马尔可夫链的现实意义是在个变化过程中,在已知现
在情况的条件下,系统未来时刻的情况只与现在有关,而与过去的历史无直接关系。
马尔可夫过程代表数学中具有马尔可夫性质的的离散随机过程。该过程中,每个状态的 转移只依赖于之前的 n 个状态,这个过程被称为 1 个 n 阶的模型,其中 n 是影响转移状态的 数目。最简单的马尔可夫过程就是一阶过程,每一个状态的转移只依赖于其之前的那一个状 态。这和确定性系统不一样,因为这种转移是以概率的形式转移的,而不是确定性的。