文档介绍:铆论文提交日期——同等学力申请硕士学位论文基于码本的输入法评测系统的设计和实现研、究方向——一指导教师姓名.——研究生姓名专业名称杨季文淌计算机科学与技术张玉华中文信息处理年咿.
中文摘要在今后很长时期内,汉字键盘编码输入法仍将是汉字输入计算机的主要方式。建立科学的输入法评价体系,不仅可以指导编码发明者形成科学的汉字编码方案,而且可以帮助输入系统设计人员对输入法产品进行客观的自我评价,从而推出符合国家规范的更好的输入法产品。本文首先介绍了汉字输入法的现状和发展趋势以及汉字输入法的相关标准:然后提出了汉字输入法评测系统的设计目标,并描述了评测系统的组成;接着详细介绍了基于码本的汉字输入法静态评测子系统和汉字输入法动态评测子系统的设计和实现过程;最后还介绍了基于输入法规则库的码本自动获取子系统。本文介绍的基于码本的汉字输入法评测系统,不仅可以作为一个汉字编码输入法的通用评测平台,而且也可以作为一个汉字输入编码设计的辅助平台,也可以作为探讨国家有关规范的辅助工具。对汉字编码发明者和输入系统设计人员而言,该评测系统有很高的使用价值;对建立科学的输入法评价体系而言,该评测系统也有十分积极的意义。关键词:汉字输入法,中文信息处理,汉字编码方案,输入法评测,码本作者:张玉华指导老师:杨季文基于码奉的输入法讦测系统的设计和实现
.,.,..甎甌.,,,:¨
期:型:豪研究生签名:げ榈勘なァ日期:竺£:竺:夕日期:丝竺:驾苏州大学学位论文独创性声明及使用授权声明学位论文独创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究魉取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研究成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承学位论文使用授权声明苏州大学、中国科学技术信息研究所、国家图书馆、清华大学论文合作部、中国社科院文献信息情报中心有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布ǹ论文的全部或部分内容。论文的公布ǹ授权苏州大学学位办办理。担本声明的法律责任。研究生签名:导师签名:日
第一章绪论汉字编码输入技术的现状和发展趋势在我国几乎所有计算机用户都离不开汉字输入这一操作。人们在利用计算机处理各种信息时,需要输入汉字。如果是进行文字编辑等处理,需要输入大量的汉字;如果是查询资料或数据,那么也需要输入少量的汉字。在过去,汉字输入曾是制约计算机应用普及的瓶颈之~。目前汉字输入的主要手段仍是键盘编码输入。汉字输入方式可分为两大类:键盘编码输入方式和自然输入方式。键盘编码输入方式是指给汉字编码进而通过键盘实现输入的方式。自然输入方式是指通过字形识别或者语音识别的途径实现输入的方式。虽然语音输入和手写输入技术已渐趋成熟,语音输入和手写输入方法的识别率已相当高,但目前这些自然输入方法仍较多地受到软硬件环境的制约,所以还只是汉字输入的辅助手段。键盘编码输入方式输入速度快,无需特别的硬件支持,仍是汉字输入的主要手段。因此,汉字输入技术的主流仍然是键盘编码输入技术。本文以下所述的汉字输入技术仅指键盘编码输入技术。.鹤直嗦敕桨负秃鹤质淙敕汉字编码方案是指,给某个范围内的每个汉字赋代码的~组规则。汉字编码方案的本质是规则。不同的赋代码规则,形成不同的汉字编码方案。按制定规则的依据对汉字输入编码方案进行分类,汉字输入编码可以分为流水码、音码、形码、音形码或形音码等大类。按构成代码的码元是否为数字,汉字输入编码可分为数字码和普通码两大类。习惯上,把根据输入编码方案给汉字赋的代码称为外码,把在机器系统内部表示汉字的代码称为内码。汉字键盘编码输入法是指,根据某个汉字输入编码方案把外码转换基于码本的输入法评测系统的设计和实现
为内码的软件,因此又常被称为汉字输入系统。汉字输入法的基础是汉字输入编码方案。汉字编码方案不同,对应的汉字输入法也就不同。反过来,同一个汉字编码方案,可能存在多个对应的汉字输入法。一般用户实际操作使用的是汉字输入法,所以评价的主体也是汉字输入法,但是毫无疑问汉字输入编码方案是汉字输入法的关键。汉字编码的历史可追溯到最初字典、词典的查字法。就方法来说,有传统的部首笔画编码、四角编码、拼音排序编码等。年丹麦人制定的四码电报码一直用到今天,而成为“标准电报码本”【俊随着微型计算机应用的普及,越来越多的人在工作中需要输入汉字,由此吸引了一大批人关心汉字输入,尝试研究汉字编码方案。从年以后的近年中,数以干计的汉字编码方案相继问世,先后有嘀编码方案申请了专利,形成了万“码”奔腾