文档介绍:会计学
1
码和汉字编码(hàn zì biān mǎ)
第一页,共12页。
学****xuéxí)目标
学会(xuéhuì)用UltraEdit观察字符的十六进制内码
了解(liǎojiě)ASCII字符编码和汉字编码
1
2
第1页/共12页
第二页,共12页。
计算机除了要处理数值类型的数据外,还要处理各种非数值类型的数据,例如英文字母和汉字。为了能让计算机存储、处理这些数据,需要为每个字符规定一个二进制代码。为了便于信息的交换,必须(bìxū)采用标准化编码。
国际上普遍采用的西文字符编码是ASCII码(美国信息交换标准码)
常用的汉字编码有GB2312-80、GBK等
ASCII码和汉字编码(hàn zì biān mǎ)
第2页/共12页
第三页,共12页。
ASCII码表由128个代码(dài mǎ)组成,表示了128个西文字符,十进制代码(dài mǎ)从0-127
一个ASCII码字符占一个字节
0
ASCII码用一个字节的后7位来表示(biǎoshì)字符,最高位不用,一般为0。
二进制规则:
n个二进制位最多能表示2n种不同(bù tónɡ)的编码状态
7个二进制位最多能表示27=128种不同的编码状态
第3页/共12页
第四页,共12页。
例如:
字母(zìmǔ)“t”的ASCII码为116,也就是 1110100B,
最高位用“0”填充。
0
第4页/共12页
第五页,共12页。
汉字与西文字符一样,也是一种字符,在计算机内同样是以二进制代码表示的。用计算机处理汉字需要解决(jiějué)以下几个问题:
怎样将汉字输入计算机?
在计算机内部怎样处理汉字?
计算机怎样实现汉字信息的输出(显示)?
汉字输入
方法(fāngfǎ)
汉字输入码
自动识别
音码:全拼、双拼、智能(zhì nénɡ)ABC等
形码:五笔字型法、郑码输入法
(1)汉字输入
如手写、语音识别
第5页/共12页
第六页,共12页。
(2)汉字编码(hàn zì biān mǎ)
区号
位号
十进制
16
01
十六进制
国际码
十六进制机内码
二进制机内码
汉字编码(hàn zì biān mǎ)(GB2312-80)采用区位码表示汉字。区位码分94个区,每区94个位,构成94*94个单元的表格。“区号”和“位号”各占一字节(第一个字节标记区号,第二个字节标记位号),所以一个汉字占2个字节。
比如(bǐrú):
“啊” 的区号是16,位号是01
区、位号分别加20H
国标码+8080H
“啊”在计算机中的内码为1011000010100001
10 01
30 21
BO A1
10110000 10100001
第6页/共12页
第七页,共12页。
(3)汉字输出(shūchū)(显示)
为了汉字的输出显示和打印,需要描述汉字的字形(zì xínɡ),对汉字字形(zì xínɡ)的编码称为汉字的字形(zì xínɡ)码。
输入(shūrù)法输入(shūrù)
查找对应的区位码
区位码加2020H
转为国际码
国际码加8080H转为
十六进制机内码
转为二进制机内码
查找对应字形码
输出
归纳——汉字在计算机中的表示
第7页/共12页
第八页,共12页。
UltraEdit:十六进制(shí liù jìn zhì)内码观察器
(guānchá)字符内码
字符
二进制编码
查看到的内码
存储
ASCII码字符
8位
2个十六进制数
占1B
汉字
16位
4个十六进制数
占2B
第8页/共12页
第九页,共12页。
例1. 用UltraEdit软件观察字符内码,结果如下(rúxià)图所示:
则其中内码“32 30”表示的字符为( )
(A)2010 (B)20
(C)10 (D)假
,结果如下图所示:
将其前两个字节数据“B8 FC”删除后,则右侧的“更上一层楼”
五字(wǔ zì)将变成( )
(A)上一层楼 (B)更上一层
(C)楼层一上