文档介绍:基于国际标准码的智能蒙文输入法基于unicode编码的智能蒙文输入法摘要随着电子技术和计算机的发展,信息处理事业渗透到每一个行业和领域。而支持Unicode编码的信息处理已成为计算机技术的发展趋势。在2000年国际标准化组织(ISO)通过了国际标准码ISO一10646(GB-13000)的蒙文编码,为蒙古文字字符集和编码的统一制定了标准。从而也提出了在Windows平台上实现蒙文输入法所必须要考虑的新问题,为蒙文输入法上一个台阶提供了一条新的思路。蒙文国际标准码制定后内蒙古大学计算机学院制作了多种基于Unicode编码的蒙文Truetype字库,相应地开发了支持Unicode编码的多种蒙文输入法。这些输入法的开发对蒙文信息处理注入了生机。本文全面、系统地介绍了基于蒙文国际标准码的蒙文输入法的设计思想和实现过程,对同一领域的研究人员有较好的参考价值。关键字:输入法,IME/I删结构,国际标准码,蒙文,托忒蒙文内蒙古大学硕士学位论文第一章 ,语言信息处理工作已进入人们的月常生活,并且以日新月异的速度在发展。世界上所有文化发达的民族都在不同程度地进行着本民族的语言信息处理工作。对于不同民族的信息处理系统来讲,各文字的输入是非常重要的。中国是一个多民族的国家,蒙古族是其中之一。现行蒙古文分三种:蒙文,托忒蒙文和新蒙文。蒙文也称为旧蒙文或老蒙文,主要用于内蒙古自治区;托忒蒙文主要用于新疆地区;新蒙文主要用于蒙古国。为了加强蒙古族及其他兄弟民族之间的相互理解和相互交流,学习和掌握世界上先进的科学技术,跟上信息时代的发展步伐,我们必须发展和研制蒙古文信息处理工作,因此开发和实现适应现代要求的蒙文输入法是十分必要的。为此我们开发了基于国际标准码的多种蒙文输入方法,此项目也得到了国家自然科学基金项目和教育部人文社会科学重大项目的支持。这次我们开发的蒙文输入法最大的特点是采用了国际标准码,即Unicode码。Unicode是一种重要的交互和显示的通用字符编码标准,它覆盖了美洋的主要的语言,以及古文和专业符号。作为一个计算机的多字节字符表示系统,Unicode支持世界上所有语言的编码和转换。关于蒙古文编码从80年代初开始,我国和蒙古国、德国、日本、匈牙利、美国以及我国台湾等不少国家和地区的蒙古学学者们分头研制了不同的蒙古文编码。这些编码虽然在不同的范围内起着积极作用。但这不统一的多种蒙古文编码,防碍着蒙古文的全球性交流、通信和资源共享等信息时代的实现。因而研制了适应现代化、信息化时代要求的蒙古文国际标准编码。而支持蒙文国际标准编码的输入系统的研制不仅对蒙古文信息处理具有实际的意义,对蒙古文文化教育事业甚至对整个民族的长远发展将起到一定作用。:1)键盘输入:通过键盘把文字输入到计算机,这是目前最常用的一种输入方法。2苎主里堕塑堡曼塑塑望茎奎塑垒鲨2)笔识别输入:笔识别输入法是指使用手写板(扫描仪)获取用户书写汉字或符号的笔划或图像信息,使用模式识别的方法,将笔迹转化为对应的文字。比如常用的汉字应用软件有:汉王笔,慧笔等。3)语音输入:指通过麦克风获取用户文字发音的语音信号,通过使用模式识别的方法,将其转换为对应的文字。目前实现的蒙文输入方法都属于键盘输入,其它输入法正在实验当中。蒙文键盘输入法主要分成以下五种:1)键盘直接输入法:键盘直接输入法与铅字印刷的拣字过程非常接近。把蒙文的每一个字形对应键盘的一个按键,从而达到输入蒙文的目的。2)拼音输入法:拼音输入法是根据拼音字母与蒙文字母的读音接近的原则,建立蒙文字母与键盘的对应关系。根据蒙文字母按对应的键时屏幕上显示与此字母读音相关的各种书写形式,再通过数字键选择需要的蒙文字母。3)蒙文拉丁转写输入法:蒙文拉丁转写输入法就是通常说的蒙文读音输入法。这种输入法是以蒙文的一个词作为基本单位的输入方法。4)词组输入法:词组输入法是以一个蒙文词组作为一个单位,通过输入词组所对应的输入代码串得到响应的词组。5)整词输入法:整词输入法是把蒙文的整词用音节分解后对不同的音节取相应的编码。再经过一定的编码规则和一些数据库得出对应的整词。这种输入法相对与拼音输入法和读音输入法击键次数少,速度快。,我参加的基于国际标准码的蒙文输入法有三种:1)蒙文拼音输入法2)蒙文读音输入法3)蒙文词组输入法托忒蒙文的输入法有两种:1)托忒蒙文拼音输入法2)托忒蒙文读音输入法3内蒙古大学硕士学位论文第二章 输入法的实现方式输入方法的实现主要包括三种实现方式:第一直接实现方式;第二使用Windows操作系统提供的挂钩(Hook)机制方式,