1 / 3
文档名称:

专业人力资源100项工具-82马尔可夫链模型.pdf

格式:pdf   页数:3
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

专业人力资源100项工具-82马尔可夫链模型.pdf

上传人:wiztre 2014/1/16 文件大小:0 KB

下载得到文件列表

专业人力资源100项工具-82马尔可夫链模型.pdf

文档介绍

文档介绍:专业人力资源 100 项工具
100 项工具
82、马尔可夫链模型
马尔可夫模型(Markov Model)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率
文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功应用,使它成为一种通用的
统计工具。
马儿可夫过程
到目前为止,它一直被认为是实现快速精确的语音识别系统的最成功的方法。复杂的语音识别问题通过隐
含马尔可夫模型能非常简单地被表述、解决,让人们由衷地感叹数学模型之妙。
主要应用于语音识别、音字转换、词性标注。
自然语言是人类交流信息的工具。很多自然语言处理问题都可以等同于通信系统中的解码问题-- 一个人
根据接收到的信息,去猜测发话人要表达的意思。这其实就象通信中,人们根据接收端收到的信号去分析、理
解、还原发送端传送过来的信息。比如一个典型的通信系统中:其中 s1,s2,s3... 表示信息源发出的信号。
o1,o2,o3... 是接受器接收到的信号。通信中的解码就是根据接收到的信号 o1,o2,o3... 还原出发送的信
号 s1,s2,s3...。
其实人们平时在说话时,脑子就是一个信息源。人们的喉咙(声带),空气,就是如电线和光缆般的信道。
听众耳朵的就是接收端,而听到的声音就是传送过来的信号。根据声学信号来推测说话者的意思,就是语音识别。
这样说来,如果接收端是一台计算机而不是人的话,那么计算机要做的就是语音的自动识别。同样,在计算机
中,如果我们要根据接收到的英语信息,推测说话者的汉语意思,就是机器翻译;如果我们要根据带有拼写错
误的语句推测说话者想表达的正确意思,那就是自动纠错。那么怎么根据接收到的信息来推测说话者想表达的
意思呢?人们可以利用叫做“隐含马尔可夫模型”(HiddenMarkovModel) 来解决这些问题。以语音识别为例,
当我们观测到语音信号 o1,o2,o3 时,要根据这组信号推测出发送的句子 s1,s2,s3。显然,人们应该在所
有可能的句子中找最有可能性的一个。用数学语言来描述,就是在已知 o1,o2,o3,... 的情况下,求使得条
件概率
专业人力资源 100 项工具-82 马尔可夫链模型 1
专业人力资源 100 项工具
P(s1,s2,s3,...|o1,o2,o3....) 达到最大值的那个句子 s1,s2,s3,...
当然,上面的概率不容易直接求出,于是人们可以间接地计算它。利用贝叶斯公式并且省掉一个常数项,
可以把上述公式等价变换成
P(o1,o2,o3,...|s1,s2,s3....)*P(s1,s2,s3,...)
其中
P(o1,o2,o3,...|s1,s2,s3....) 表示某句话 s1,s2,s3... 被读成 o1,o2,o3,... 的可能性,而
P(s1,s2,s3,...) 表示字串 s1,s2,s3,... 本身能够成为一个合乎情理的句子的可能性,所以这个
公式的意义是用发送信号为 s1,s2,s3... 这个数列的可能性乘以 s1,s2,s3... 本身可以一个句子的可能性,
得出概率。
(读者读到这里也许会问,你现在是不是把问题变得更复杂了,因为公式越写越长了。别着急,就来简化