文档介绍:基于UN I GODE编码的蒙文编辑器+
捅 要
基于UNICODE编码的蒙文编辑器作为蒙文信息处理平台(MIPP)课题的一个子课题,它是蒙文信息处理工作的重点、难点之一,而且是蒙文信息处理的一项基础性研究工作。这项工作做好了,最直接的成果就是产生一个具有实用价值的蒙文文字处理软件,而且对于处理基于UNICODE编码的蒙古语言文字必将积累大量的技术、理论和经验,对后续的研发工作产生积极的影响。
本文首先分析了提出该课题的背景知识和国内外研究现状、发展动态, 简要介绍了蒙古文语言文字的发展和使用情况,介绍了蒙古文字的编码发展情况,重点介绍了基于UNICODE标准的新的蒙古文编码方案以及使用特点,然后讲述了实现本课题所使用到的工具和技术:Rational Rose可视化软件设计工具、Visual c++可视化开发工具、MFC的FrameWork技术、软件国际化编译技术和UNICODE编码文字处理技术,在此基础上重点讲解了该课题的实现细节,给出了处理基于UNICODE的蒙古文文字的一些技术和理论问题,并且讲述了该系统的测试方法。最后,我对系统的性能做了简单地分析。
关键词:蒙古文,蒙文编码, UNICODE,蒙文国际标准码,MFC,蒙文
编辑器
’基金项日:奉义得到教育部^文社会科学研究重大项目-蒙古文信息处理平台(MIPI,)的研究一(项目编号:02『^Z]D850003)和
国家自然科学基金项目“基于WEB的藏文闰书信息管理系统”(项目编号:60163003】瓷助
.1-
内蒙古大学硕士学位论文
第一章引 言
内蒙古大学蒙文信息处理实验室早在80年代束,90年代初就开发出了一套处理蒙文的排版软件,这个软件在西文DOS操作系统下,能够直观地实现蒙文、中文和西文的混排,能够实现图表文字的混排,实现了打印和打印预览,为了实现蒙文和其它文种的混排,避免系统中蒙文、中文和西文的文字编码冲突,将140个蒙文字形和符号安排在汉字没有占用的第 90区,蒙文内码的高位也不像汉字一样加160,成功的解决了内码冲突,在当时的技术背景下,取得了很好的成果。由于当时蒙文编码的国际标准还没有出台,各种编码方案的不统一是蒙文信息处理国际化的绊脚石。随着计算机技术的发展,以Windows为代表的图形操作系统逐步占据了主导地位,2000年,出台了蒙文UNICODE标准,迫切需要研发出基于UNICODE 编码的蒙文编辑器。
当前市面上的排版软件很多,市场占有率高的有微软的WORD,国产优秀软件WPS等。WORD 以其友好的界面和强大的功能,赢得了市场的高额回报,当然,成绩的背后是一个技术实力雄厚的上千人组成的团队多年来的辛勤劳动。目前版本的WORD支持竖排,但是,只支持从右向左的书写方向,蒙文的书写方向是从左向右,所以不能够支持蒙文的排版。WPS是国产软件的奇葩,是民族软件的领头羊。最近,金山公司推出Windows2000环境下的带有蒙文界面的WPS系统,能够支持UNICODE编码的蒙文排版。但是,考虑到软件版权,WPS的技术细节并没有公布,成功的经验很难借鉴。最近北大方正推出了Windows环境下的900系统,把原来DOS下的排版系统升级到Windows环境。这些系统以文字处理(排版)为目标,并不具备通用平台的功能。
现在迫切需要一种以蒙文新标准码为编码体系的蒙文信息处理(软件开发)处理平台(MIPP),使蒙古文字与其他台环境下工作。新的国际标准码只定义了名义字符表179个码位,对于1000多个显现字符表未给出编码位置。根据国家民委的精神,该标准包括老蒙文、满文、托忒蒙文、锡伯文等,都包括在蒙文系列文字内。该系统研制成功之后,将会对蒙文、满文、托忒蒙文、锡伯文等信息处理事业起到重要的推动作用,为处理这些文种的软件二次开发提供一个基本平台。作为一个蒙文信息处理的科研单位, 有必要而且必须开发一个以处理蒙文为主,能够与其它文种混排的软件系统,这样,才能够积累大量的经验,形成自己有特色的产品链,为蒙文信息处理平台的其它课题提供经验,因此,开发基于UNICODE编码的蒙文编辑器是当前技术背景下MIPP的一个重要子课题。
基于UNICODE编码的蒙文编辑器
MIPP课题的基本内容包括四个方面:
●文字信息处理模块:(1)蒙文True Type字库:(2)蒙文输入法及外挂方式实现蒙文的输入;(3)蒙文编辑器;蒙文与其它文种最大的不同点在于书写方式上。蒙文书写是从上到下、由左向右的方向竖写。因此,我们需要开发一个面向蒙文的文本编辑软件;(4)搜索和排序:(5)对蒙文、满文、托忒蒙文、锡伯文等四个文种,提供名义字符串转换成显现字符串,显现字符转换成名义字符等编码转换功能。
●支持数据库的功能:(1)本平台将支持蒙文数