文档介绍:知识水坝论文
重庆大学
硕士学位论文
汉字编码输入法研究
姓名:戴石麟
申请学位级别:硕士
专业:计算机软件与理论
指导教师:曾一
20050301
知识水坝论文
中文摘要
摘要
汉字编码输入一直是汉字信息处理领域中参与人数最多、研究得最多、讨论得
最热烈、产品竞争最激烈的领域。虽然目前的汉字编码输入法已有成千上万,然
而对它的研究热潮仍然一浪高过一浪。纵观为数众多的汉字编码输入法,大多为
低水平的重复设计和开发,技术上的突破很少,理论上的创新就更为罕见了,造
成了巨大的人力、物力和财力的浪费。
本文在全面分析汉字编码键盘输入法的历史和现状的基础上,以信息论和软
件工程为指导,结合认知心理学和人体工程学原理,根据用户的实际需要,从理
论和实践两方面着手来研究汉字编码输入法,建立了一个科学的汉字编码输入系
统模型,阐述了汉字编码输入法的几项重要评测指标,设计和实现了一套综合性
能非常优秀的汉字编码输入法——声笔系列码。
本研究的结果表明:(1)汉字编码输入法的研发是一个系统工程,必须在编
码层面和软件层面同时改进才能取得理想的效果。(2)“易学的不快,快的不易学”
这一对缠绕人们多年的汉字输入法研究和使用中的矛盾是可以解决的。(3)汉字
信源的统计特征对具体用户来说不是一成不变的,而变化的统计特征可以被利用
来提高汉字输入的效率。(4)汉字输入时的人机交互应当适可而止,不能过多也
不能过少。(5)汉字编码输入法可以基本上实现在通用键盘和数字键盘上的互操
作。(6)大型数据库用于汉字编码输入法是可行的和有效的。(7)通过对数字键
盘上字母的布局进行适当的调整,结合巧妙的编码方法,完全可以实现在数字键
盘上简单、快捷地输入汉字和英文,包括各种标点符号和带调汉语拼音字母。(8)
使用汉字读音特征进行编码的输入法必须解决好不认识的字的输入问题,否则该
输入法就是不完备的。
声笔系列码的实验结果说明:(1)声笔系列码中的声笔码、音笔码和声笔数
码都符合国家规范。(2)声笔码比全拼还易学、易用,同时速度上已接近五笔字
型。(3)音笔码的学习难度仅与双拼相当,易于盲打,比五笔字型容易得多,对
一般的连续文本动态其平均码长却比五笔字型缩短了约 10%。(4)声笔数码与 T9
拼音、T9 笔画的学均码长比 T9 拼
音缩短了约 36%,比 T9 笔画缩短约 12%。
关键词:汉字编码,键盘,输入法,中文处理
I
英文摘要
ABSTRACT
Within Chinese information processing, the encoded input of Chinese characters
has been the field that is most researched and extensively discussed and where most
people participate in, with products in most petition. Although there are
already thousands of encoded input methods of Chinese characters at present, but the
research on them is still increasing continuously. Looking at majority of current
encoded input methods of Chinese characters, most of them are repetitions in design
and development at a lower level with little technical breakthrouth and rare theoretical
innovation, resulting in huge waste of manpower, resources and money.
Based on prehensive analysis of the history and status quo of encoded
keyboard input methods of Chinese characters, guided by information theory and
software engineering, combined with the principles of cognit