文档介绍:——ASCII(一ASCII=美国标准信息交换码(二标准ASCII:采用7个二进位进行编码共有128个字符,包含96个可打印字符(常用字母、数字、标点符号等和32个控制字符(三基本ASCII与扩展ASCII的比较:基本ASCII扩展ASCII相同用一个字节(8b存放不同点高位为“0”高位为“1”(四常见字符的ASCII码对照表:字符十进制大小顺序回车符(控制字符13空格(控制字符32数字0~948~57大写字母A~Z65~90小写字母a~z97~(一GB23121981年我国颁布了第一个汉字编码国家标准GB2312—80(6763个汉字组成:第一部分:字母、数字和各种符号第二部分:一级常用汉字(共3755个,按汉语拼音排列第三部分:二级常用汉字(共3008个,:区位码:GB2312国标字符集构成一个二维平面,它分成94行(行号称为区号、94列(列号称为位号。每个汉字的区号和位号分别用1个字节来表示。国标交换码:每个汉字的区号和位号分别加上32D(00100000B。机内码(内码:把一个汉字看作两个扩展ASCII码,在国标交换码的基础上使两个字节的最高位都等于“1”,即分别加上128D(10000000B区位码、国标码、:早、小、双、简(二GBK1995年发布共有21003个汉字和883个图形符号支持繁体字,包含了中、日、韩认同的全部CJK汉字;双字节编码向下兼容GB2312-80(三GB180302000年发布产生原因:保护我国已有的大量信息资源,既能与UCS/Unicode编码标准接轨,又能向下兼容GB2312和GBK汉字编码标准备注:UCS/Unicode:Windows、UNIX、Linux操作系统和许多最新的软件标准都在使用UCS/Unicode。共有27000多个汉字(收录字符最多不等长编码(四BIG5:台湾地区的字符编码,不支持简体中文,与GB2312等大陆标准不兼容(五GB2312、GBK、GB18030、UCS/Unicode的比较GB2312GBKUCS/UnicodeGB18030出现时间1981年1995年2000年意义最早首次支持繁体能实现全球所有不同语言文字统一编码的国际编码标准支持汉字数目最多汉字数目6763个21003个2万多汉字27484个支持繁体否是是包含CJK否是是是编码方式双字节双字节不等长编码1B、2B、3B不等长编码1B、2B、4B兼容性向下兼容GB2312不兼容向下兼容GB2312和GBK与UCS/(输入文本信息输入人工输入自动识别输入键盘输入联机手写输入语音输入印刷体识别手写体识别(一汉字的键盘输入编码(:易学、易记、效率高、重码少、容量大分类:数字编码、字音编码(字音编码、字形编码(五笔字形、形音编码注意:用不同的输入编码方法输入同一个汉字,其内码是一样的。(二联机手写汉字识别——笔输入设备(三印刷体汉字识别输入——扫描仪、(一按是否具有编辑排版格式分:、ASCII文本,其文件的后缀为“.txt”(文本文件定义:由一连串用于表达正文内容的字符的编码组成,几乎不包含任何其他的格式信息和结构信息特点:没有字体、字号的变化,不能插入图片、表格、:用来说明文本的版面结构、内容组织、文字的外貌属性等组成:正文+标记标记语言:普通:RTF网页:HTML(超文本标记语言、XML(可扩展的标记语言5不同的文字处理软件使用的标记语言不同,Word无法打开“*.pdf”文件