1 / 3
文档名称:

汉字‘身份证’杂谈、趣谈(二) ----‘语委身份证’及‘标准身份证’.doc

格式:doc   大小:44KB   页数:3页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

汉字‘身份证’杂谈、趣谈(二) ----‘语委身份证’及‘标准身份证’.doc

上传人:sxlw2014 2018/7/19 文件大小:44 KB

下载得到文件列表

汉字‘身份证’杂谈、趣谈(二) ----‘语委身份证’及‘标准身份证’.doc

相关文档

文档介绍

文档介绍:汉字‘身份证’杂谈、趣谈(二)
----‘语委身份证’及‘标准身份证’
两种‘身份证’的比较(即《字表》与《编码标准》的比较)
乙:那么,汉字身份证问题,应该如何理解,如何处理?新时期汉字的‘身份证’到底什么意思呀?
甲:现在如果从实际出发,应该承认有两种‘身份证’:一种是‘语委身份证’;另一种是‘标准身份证’。两种身份证有严重打架现象。语委身份证,是以国家语委的法规为依据判定。那些异体字直到2003年《字表》发布才获得语委身份证。而按汉字编码技术标准看,1993年就获得了标准身份证。对于繁体字,1993年也获得了‘标准身份证’,而国家语委至今还是扣发着繁体字的‘语委身份证’,王组长更是明确地把繁体字称为“不规范字”;这就像是给繁体字脖子上挂上一块‘走资派’的牌子一样。这是同一个国家、两个部门在打架。
乙:看来,收进《字表》,就算有了‘语委身份证’了。那‘标准身份证’的判据是什么?
甲:电脑时代,有‘标准身份证’应该是指‘能够在网络上为广大海内外汉字用户使用’,显然地,这个‘使用’是通过‘电脑’及/或‘网络’的‘使用’。一个汉字能够做到这一点,仅仅要求它是汉字编码标准字符集里的成员。具体些说:它具备如下5条:①被收入标准化的编码字符集。②在汉字编码表里获得一个位置,或得到一个属于它的二进制代码。这种编码字符集结构越来越复杂。③给出它的字形信息,包括一般至少四种字体(宋、仿、隶、楷),每一种字体的数十种字号(如初号、一号、......五号、小五号、六号、...)的不同点阵精度的(15*16、24*24、...128*128、...256*256...)点阵字形信息。④有多种汉字输入法给出了每个汉字的输入代码,及大量涉及该字的词汇、短语的输入代码。⑤有相应的操作系统及文字处理软件。特别是前四款,必须对每一个汉字单独给出。从这五个条件看:1993年,这些异体字仅仅解决了①、②、③;到1995年五条都具备。而国家语委给予的仅仅是①。以上五款中的每一项(也可以不妨除去①)都包含着大量、繁杂的技术工作。就说第②款吧。对于最早、最简单的汉字基本集来说,它收汉字6763个。其中每个用两个字节(两个8位二进制数码)表达。整个基本集用一张94*94的表格表示。对于GBK1 和 GBK2来说,即使用双字节编码,也使用四字节编码。其编码表结构复杂得多。下面图表是解说编码结构时通常需要引用的。对于理工科大学生,讲解这个结构图表也需化不少时间那。

GB18030-2000码位总体结构图
GB18030-2000汉字
如下表所示,GB18030-2000收录了27533个汉字:

类别
码位范围
码位数
字符数
字符类型
双字节部分
第一字节 0xB0-0xF7
第二字节 0xA1-0xFE
6768
6763
汉字
第一字节0x81-0xA0
第二字节0x40-0xFE
6080
6080
汉字
第一字节0xAA-0xFE
第二字节0x40-0xA0
8160
8160
汉字
四字节部分
第一字节0x81-0x82
第二字节0x30-0x39
第三字节0x81-0xFE
第四字节0x30-0x39
6530
6530
CJK统一汉字扩充A
(注:此处CJK表