1 / 12
文档名称:

基于Unicode编码的蒙古文输入法研究.doc

格式:doc   大小:36KB   页数:12
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于Unicode编码的蒙古文输入法研究.doc

上传人:bodkd 2021/5/8 文件大小:36 KB

下载得到文件列表

基于Unicode编码的蒙古文输入法研究.doc

文档介绍

文档介绍:基于Unicode编码的蒙古文输入法研究
第24卷第6期
2010年11月
中文信息
JOURNALOFCHINESEINFORMATIoNPROCESSING
,
NOV.,2O10
文章编号:1003—0077(2010)06—0120—05
基于Unicode编码的蒙古文输入法研究
范道尔吉,白凤山,武慧娟
(内蒙古大学电子信息工程学院,内蒙古呼和浩特010021)
摘要:从Vista开始微软操作系统已经完全支持了传统蒙古文的输入,
,自动联想输入,
,并详细探讨了蒙古文字典数据的
存储和使用方法,最后提出了自动学习算法和资源共享技术的解决方案.
关键词:蒙古文输入法;Unicode;自动变形;Uniscribe
中图分类号:TP39l文献标识码:A
ResearchonMongolianInputMethodinUnicode
FANDaoe~,WUHuijtman
(CollegeofElectronicInformationEngineering,NeiMongolUniversity,Hohhot,InnerMongolia010021,China)
Abstract:Microsoft'SoperatingsystemhasstartedtOfullysupportthetraditionalMongolianinput,editingand
,thispaperproposesanewalgorithmforthe

calculation,automaticassociationinput,—

liandictionarydatastorage,anddescribestheautomaticlearningalgorithmsandthesolutiontOtheresourcesha—
ring.
Keywords:Mongolianinputmethod;Unieode;automaticdeformation;Uniseribe
1引言
蒙古文国际标准编码字符集中收录了传统蒙文
的7个元音,27个辅音,1】个标点符号,1O个数字

抽象的蒙古文字符(称为名义字符),而同一个蒙古
文字符的书写(显现形式)会根据其在词语中的位置
不同,单词的词性等属性不同而发生变化,即呈现在
人们面前的是该字符变化后的形式(称为显现字
形).由于IS0/IEC10646标准中没有收人蒙古文
显现字符,因此在显示蒙文时需要将蒙古文的名义
字符根据上下文映射到其相应的显现字形_1].
微软的Vista操作系统当中已经支持了上述蒙
古文的变换处理,Office2007也支持蒙古文的竖排
,但是
这个输入法用起来不够方便,文字输入速度不够快.
不方便之处在于文字变形时候由用户判断使用哪一
个控制符号,因此必须学习蒙古文的变形原理和控
制符号功能,
较长,平均有lO个左右(对一个蒙古文字典数据的
统计),
出了一种新型蒙古文输入法算法.
收稿日期:2009—10—17定稿日期:2010一O1—13
基金项目:内蒙古自治区教育厅项目(Z2007—1—01025)
作者简介:范道尔吉(198o一),男,研究生,讲师,主要研究方向为嵌人式系统,蒙古文信息化;白凤山(1964一),男,研究
生,教授,主要研究方向为计算机与通信系统;武慧娟(1981一),女,研究生,讲师,主要研究方向为计算机与通信系统.
6期范道尔吉等: