1 / 4
文档名称:

基于HMM的汉语整句拼音输入法研究.pdf.pdf

格式:pdf   页数:4
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于HMM的汉语整句拼音输入法研究.pdf.pdf

上传人:dfjmvg964 2015/12/21 文件大小:0 KB

下载得到文件列表

基于HMM的汉语整句拼音输入法研究.pdf.pdf

文档介绍

文档介绍:维普资讯
\
、竺
基于的汉语整句拼音输入法研究★
贾剑峰, 史晓东, 赖兴邦
厦门大学信息科学与技术学院人工智能所,厦门
摘要:介绍了一种基于/的汉语整句拼音输入转换为整句汉字的输入法, 提出了引入语
言知识后的一种音字选择方法。并给出了采用元拼音文法时的选择模型。实验表明。
该方法取得了较好的效果。
关键词:智能拼音输入法;隐马尔可夫; 元模型

时,称为一步转移概率,简称为转移概率,记为,即
拼音输入法从输入的基本单位上又可以分为字、
有转移概率矩阵:
词、语句三级。字的输入技术特点是以字为输入单
口⋯口≤口,≤

得重码很多。候选字多。影响输入速度;词级的输入技⋯

“联想”输入方式也可以归为. 模型

;
输入技术是以短语、句子为整个输入单位来进行转只能看到观察值,不能直接看到状态。

:模型中链的状态数目
:每个状态对应的所有可能出现的观察值的数
的信息关联:

于一维熵。因此候选词比字、词一级的候选表要少的
霄:初始状态概率矢量。其中:
多。
,≤≤
相关描述:状态转移概率矩阵
:观察值概率矩阵
的随机过程是状态转换和观察值产生的双重过程【】。
.
:汉字之间的语言统计关系对应为中
现上可以给出如下的定义:随机序列。在任一时刻状态之间的转移关系:求给定拼音指出汉字的过程即

,它可以处在状态,...,,


算状态为的概率,只与它在时刻的状态有
,即有: . 改进的模型
在中每个状态。生成观察值的生成概
总【.一.,⋯, ,
率是独立的,而在一些情况下,独立性假设并
第【置户同.
二★基金项目:项目.、福建省重点科技项目.、福建省基金项目.

收稿日期:——修稿日期:—

作者简介:贾刽峰。男,新疆伊宁人,硕士研究生,研究方向为自然语言处理


.
维普资讯
兰////
不准确,比如说在出现“生长”一词时,“长”读”
的概率应该与“生”
改为。一.。的二元生成概率,通过上文的影响来偿,