1 / 77
文档名称:

信息的编码汉字编码.ppt

格式:ppt   大小:524KB   页数:77页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

信息的编码汉字编码.ppt

上传人:892629196 2020/12/12 文件大小:524 KB

下载得到文件列表

信息的编码汉字编码.ppt

文档介绍

文档介绍:信息的编码汉字编码
用计算机处理汉字信息需要解决的几个问题:
(1)怎样将汉字输入计算机?
(2)在计算机之间怎样交换汉字信息?
(3)在计算机内部怎样处理汉字?
(4)计算机如何实现汉字信息的输出?
(1)怎样将汉字输入计算机?
——输入码
向计算机输入汉字的两种方法:
(1)自动识别方式(字形/语音)
(2)将汉字编码(输入码、外码)输入:
音码/形码
例子:拼音/五笔;
(2)在计算机之间怎样交换汉字信息? ——交换码(区位码)
为了方便数字系统之间汉字信息通信交换的需要,1981年,国家颁布编号为GB2312-80标准《信息交换用汉字编码及字符集》,这种汉字交换用的代码又称为区位码.
汉字的编码-交换码(区位码)


01
02
……
93
94
01
02
……
16


17


……
94
区位码的第一个字节标记区码,第二个字节标记位码。
由于汉字多于256个,故在计算机中用2个字节来存储汉字。
(3)在计算机内部怎样处理汉字? —处理码
处理码:计算机内部用于信息处理的汉字代码,也称机内码、内码。
已知:一个区位码占用两个字节,每个字节最高位为0;英文字符的机内码是7位ASCII,最高位也是0。
思考:两者如何区分呢?
为了在计算机中能区分二者,将区位码最高位置的0改设置为1(故ASCII码小于128,机内码大于128)并将区号和位号各增加一个适当的常数,构成了汉字的机内码。
可以用UltraEdit等软件观察字符内码
(4)计算机如何实现汉字信息的输出? —字形码
汉字字形通常有两种表示方式:点阵方式和矢量方式.
0000000
0001000
0010100
0100010
0100010
0111110
0100010
0100010
0000000
0000000
0001000
0010100
0100010
0100010
0111110
0100010
0100010
0000000
课堂练****br/>1、存储两个汉字内码所需要的字节是(  )
A)8个         B)4个          C)2个         D)1个
B
2.用UltraEdit软件观察字符“ASCII字符”的内码,结果如下图所示:
图中字母“A”的内码是( )
(A)41 (B)41 53 (C) 49 (D)49 49
A