文档介绍:——ASCII(一ASCII=美国标准信息交换码(二标准ASCII:,包含96个可打印字符(常用字母、数字、标点符号等和32个控制字符(三基本ASCII与扩展ASCII的比较:基本ASCII扩展ASCII相同用一个字节(8b存放不同点高位为“0”高位为“1”(四常见字符的ASCII码对照表:字符十进制大小顺序回车符(控制字符13空格(控制字符32数字0~948~57大写字母A~Z65~90小写字母a~z97~(—80(:第一部分:字母、数字和各种符号第二部分:一级常用汉字(共3755个,按汉语拼音排列第三部分:二级常用汉字(共3008个,:区位码:GB2312国标字符集构成一个二维平面,它分成94行(行号称为区号、94列(列号称为位号。每个汉字的区号和位号分别用1个字节来表示。国标交换码:每个汉字的区号和位号分别加上32D(B。机内码(内码:把一个汉字看作两个扩展ASCII码,在国标交换码的基础上使两个字节的最高位都等于“1”,即分别加上128D(B区位码、国标码、:早、小、双、简(,包含了中、日、韩认同的全部CJK汉字;-80(:保护我国已有的大量信息资源,既能与UCS/Unicode编码标准接轨,又能向下兼容GB2312和GBK汉字编码标准备注:UCS/Unicode:Windows、UNIX、Linux操作系统和许多最新的软件标准都在使用UCS/Unicode。((四BIG5:台湾地区的字符编码,不支持简体中文,与GB2312等大陆标准不兼容(五GB2312、GBK、GB18030、UCS/Unicode的比较GB2312GBKUCS/UnicodeGB18030出现时间1981年1995年2000年意义最早首次支持繁体能实现全球所有不同语言文字统一编码的国际编码标准支持汉字数目最多汉字数目6763个21003个2万多汉字27484个支持繁体否是是包含CJK否是是是编码方式双字节双字节不等长编码1B、2B、3B不等长编码1B、2B、4B兼容性向下兼容GB2312不兼容向下兼容GB2312和GBK与UCS/(输入文本信息输入人工输入自动识别输入键盘输入联机手写输入语音输入印刷体识别手写体识别(一汉字的键盘输入编码(:易学、易记、效率高、重码少、:数字编码、字音编码(字音编码、字形编码(五笔字形、:用不同的输入编码方法输入同一个汉字,其内码是一样的。(二联机手写汉字识别——笔输入设备(三印刷体汉字识别输入——扫描仪、(一按是否具有编辑排版格式分:、ASCII文本,其文件的后缀为“.txt”(文本文件2定义:由一连串用于表达正文内容的字符的编码组成,几乎不包含任何其他的格式信息和结构信息3特点:没有字体、字号的变化,不能插入图片、表格、:用来说明文本的版面结构、内容组织、文字的外貌属性等3组成:正文+标记4标记语言:::HTML(超文本标记语言、XML(可扩展的标记语言5不同的文字处理软件使用的标记语言不同,Word无法打开“*.pdf”文件(二按文本内容的组织方式分:、跳转、回溯等操作,实现对文本内容更为方便的访问3典型代表:Windows中的“帮助”文件(“*.hlp”文件(三按文本内容是否变化和如何变化分:::文档内容变化(:持续更新显示文档内容(、排版与处理(一文本的编辑、“所见即所得”(:使文本正确、清晰、美观例如:添加页眉和页脚、设置字体和字号、设置行间距,:PDFWriter、PageMaker、方正飞腾(::用户先给出查询要求,:a关键词检索b全文检索:允许