文档介绍:()网络信息采集课程教学研讨(文本)
王娇:欢迎大家参与本次教研活动。
课程资源
本课程资源包括《网络信息采集》文字主教材,12讲IP课件,及网上提供的各种辅导资料。
进行网络信息采集,需首先了解网络上的信息有哪些呈现形式。通常呈现形式有文本、图像、音频和视频。下面分别介绍。
网络信息之——文本
常用的文件格式有7类:
(1)纯文本文件:,可以在Windows环境下用记事本或写字板等软件打开,在DOS下也可以阅读。纯文本文件是无格式的,即文件里没有任何有关字体、大小、颜色、位置等格式化信息。
(2)Word文件:,在Windows环境下用Microsoft Word字处理软件打开、阅读和编辑,可以在文件中嵌入图表、图片、数字公式以及建立超链接等。
(3)PPT文件:,在Windows环境下用Microsoft PowerPoint软件打开、阅读和编辑。PowerPoint是制作演示文稿的软件,同时还可以设置不同的格式对演示文稿进行放映。
(4)XLS文件:,在Windows环境下用Microsoft Excel电子表格软件打开、阅读和编辑。Excel可用于输入输出、显示数据以及对输入的数据进行各种复杂运算。
(5)PDF文件:,可使用Adobe公司的Acread软件阅读。PDF文件是全世界电子版文档分发的公开实用标准,可完整保留原有文档的风格、字体、颜色、图像,还可以附加音乐、动画和链接。
(6)超文本格式:超文本格式作为目前互联网上最流行的文件显示格式,支持图像、动画、视频等多媒体形式,显示效果好,表现力强,且文件比较紧凑。兼容性非常好。
(7)WDL格式:,是一种非常流行的电子图书专用文件格式,它采用图文混排方式,阅读、携带都很方便。
网络信息之——图像
比较常用的有BMP格式、JPEG格式、GIF格式、TIFF格式、PSD格式、SWF格式等:
(1)BMP格式:是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,能够被多种Windows应用程序所支持。特点:包含的图像信息较丰富,几乎不进行压缩,但占用磁盘空间过大。
(2)GIF格式:是英文Graphics Interchange format(图形交换格式)的缩写。这种格式是用来交换图片的。特点:压缩比高,磁盘空间占用较少,可用许多具有同样大小的图像文件组成动画。GIF图像格式有渐显功能,即在图像传输过程中,用户可以先看到图像的大致轮廓,然后随着传输过程的继续而逐步看清图像中的细节部分。GIF图像文件短小、下载速度快,目前互联网上大量采用的彩色动画文件多为这种格式的文件。
(3)JPEG格式:,其压缩技术十分先进,可以用最少的磁盘空间得到较好的图像质量。JPEG还具有调节图像质量的功能,允许用户用不同的压缩比例对文件进行压缩。JPEG文件的应用也非常广泛,各类浏览器均支持该格式。
(4)TIFF格式:(Tag Image File format)是Mac中广泛使用的图像格式,特点:图像格式复杂、存贮信息多。该格式有压缩和非压缩二种形式。TIFF格式