文档介绍:内蒙古师范大学
硕士学位论文
面向汉字教学的错字处理工具设计与实现
姓名:李小庆
申请学位级别:硕士
专业:计算机应用技术
指导教师:林民
20100530
中文摘要“汉语热”现象及“孔子学院目0毂砻骱河镎谧呦蚴澜纾语已经成为第二语言学习的重要选择。汉语性质独特,非汉字文化圈的外国汉语学习者学习汉语难度极大,其中尤以汉字难学。汉字初学者极易将汉字写错。汉字教学难的现状已经制约了国内语文教学和汉语国际推广工作的进一步发展。不同初始特征的学习者在汉字学习过程中出现的书写错误具有不同的规律。但是,目前还没有基于大规模错字样本的书写偏误统计分析研究成果为汉字教学提供指导和服务。主要原因是错字的计算机处理碜直码、错字输入输出、错字检索统计等勾嬖诤芏嗬选4碜值谋嗦胛题主要体现在ち舻挠没接斜嗦肭薹愎婺2欢吓蛘偷错字需求,而且错字的编码由使用者自行定义,造成编码混乱,无法进行交换和共享。使用现有的各种输入法向计算机系统中录入的汉字都是标准字符集内的汉字,无法录入错字,只能以图片方式显示错字,不能支持错字的检索和统计。因此,缺乏符合国际标准的错字编码方案和简易有效的错字输入、管理方法是造成计算机难以有效处理错字信息的主要障碍。为了有效地解决计算机处理错字问题,本文重点完成了以下几方面的工作:治隽撕河锝萄Я煊虼碜址掷嗟难芯砍晒⒘艘恢质屎霞算机处理、以字形为依据的错字分类方案。院鹤肿中翁卣魑R谰荩赨国际标准,建立了一种以正字为中心、范围可扩展的错字编码方案,即采用正字加表意文字变体选择符组成的变体序列琁为错字编码的方案。这种方案使错字的编码统一到国际标准编码框架下,并在编码层次与正字建立了关联,能够有效地表示和管理大规模错字。捎肙悄茏痔寮际跏迪至薎模式的错字编码方案。并使用专业字体制作工具设计完成了具有一定数量的宋体错字内蒙古师范大学硕士学位论文
享问题,为基于大规模错字样本的书写偏误定量分析建立了基础。这些字库,为错字可以与正字一样进行计算机处理建立了基础,可在记事本等软件中实现错字与正字同文显示、统一检索。谏鲜龅拇碜直嗦敕桨负蚈碜肿挚猓杓剖迪至一个面向汉字教学研究人员、操作简便的错字输入插件工具。使用该工具可以向、热砑惺淙氪碜帧与内码输入方法相比,该方法极大地提高了输入速度,操作也更加方便、简易,适合非专业人员使用二本文的以上工作成果有效地解决了错字输入输出、检索、管理和共成果能够用于其它各种需要处理错字的应用领域,如在各类汉字书写评测试题、汉字教学系统、汉字教学研究论文中输入处理错字等,对汉字教学的理论研究和教学实践都具有重要的实用意义。此外,这些成果还可以进一步推广用于处理古籍异体字、甲骨文、民俗拼合字等特殊汉字领域,对利用计算机进行汉字历史文化研究将发挥辅助作用。关键词:汉字,错字处理,琁,字体,插件内蒙古师范大学硕士学位论文
,.’’瑃甌疭,,.’,.猻;’’琒,.瑃
瑃甧—.琒.,内蒙古师范大学硕士学位论文,,.,,.—.
篊,,琌閏琣.‘’,琣,,,’猻甌,...,—甀,琁狪
签名:奎灰导师签名:南签名:。本人保证所呈交的论文不侵犯国家机密、商业秘密及其他合法权益。与我一同工作的同志对本研究所做的任何贡献均已?勰关于论文使用授权的说明交论文的复印件和磁盘,允许论文被查阅和借阅,可以将学位论文或扫描等复制手段保存、汇编学位论文,并且本人电子文档的内容作及取得的研究成果,尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不在论文中作了明确的说明并表示感谢。日期:露本学位论文作者完全了解内蒙古师范大学有关保留、使用学位论文的规定:内蒙古师范大学有权保留并向国家有关部门或机构送的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。日期:/月
,世界各国普遍出现了“汉语热”现象,汉语逐渐成为第二语言学习者的重要选择。“孔子学院”在世界多个国家的创办进一步推动了汉语国际化进程,方块字正在走向世界。汉语属于表意文字体系。汉字是汉语的书写符号,性质独特,尤其是在基本符号、结构规则、书写方式等方面都不同于表音文字。对非汉字文化图的学习者来说,汉字是他们学习汉语最直接也是最大的障碍。“汉语难学,汉字更难学”,“汉字识读难,书写更难”等突出问题和普遍共识长期困扰着非汉字文化圈的外国汉语学习者Ⅲ。国内语文教学和汉语国际推广工作者在教学实践过程中都发现:学习汉字是汉语学习的瓶颈,汉语学习者初