文档介绍:网络传播中的信息利用新技术摘要:本文探讨了网络传播中的信息开发利用新技术,包括数据采掘和知识发现技术、 XML 、自动分类与自动摘要、智能搜索引擎技术,并讨论他们对新闻传播工作的影响。关键词:网络传播,数据采掘,知识发现, XML ,自动分类,自动摘要,智能搜索引擎 New Technology for Information Utilization munication Abstract: The thesis discusses the New Technology for Information Utilization munication ,includes Data Mining ,knowledge discovery ,Automatic classification and abstract ,Intelligent search engine. Keywords: munication ,Data Mining ,knowledge discovery ,Automatic classification and abstract ,Intelligent search engine. 在网络时代,广大新闻传播工作者和受众面临信息过载的难题。人们一方面被信息淹没,一方面却饥饿于知识和有用信息。大量的信息不能进行及时有效的开发利用。面对信息爆炸,如何才能不被信息的汪洋大海所淹没,从中及时发现知识、有用的信息、新闻、或新闻线索,使信息真正成为资源,正在成为各国研究的热点。从技术上看,目前主要有种解决方案。一数据采掘和知识发现技术在某种意义上说目前我们不是缺少信息,而是被信息淹没了。在因特网上有无穷的信息和数据。目前的数据库系统和搜索引擎可以高效地实现数据的统计、查询等功能,但是无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,缺乏挖掘数据背后隐藏的有用的信息、知识、新闻、或新闻线索的手段,导致了“数据爆炸但知识贫乏”的现象。人们需要有新的、更有效的手段对各种大量数据进行挖掘以发挥其潜能,数据挖掘正是在这样的应用需求环境下产生并迅速发展起来的,它的出现为自动和智能地把海量的数据转化为知识、有用的信息、新闻、或新闻线索提供了手段。数据采掘与知识发现(KDD) 一词首次出现在 1989 年8月举行的第 11届国际联合人工智能学术会议上。知识发现(KnowledgeDiscovery )研究的主要目标是采用有效的算法,从大量现有或历史数据集合中发现并找出最初未知、但最终可理解的有用知识,并用简明的方式显示出来。数据采掘(Data Mining) 就是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中,提取隐含在其中的、先前未知的、但又是潜在有用的信息和知识的过程。数据采掘在一些文献中有些相近似的名称,如数据开采、发现知识(KDD) 、知识采掘、知识抽取、知识考察、数据融合(Data Fusion) 等。知识发现是一个从数据中提取出有效的、新颖的、潜在有用的并能最终被人理解的知识、有用的信息、新闻、或新闻线索的过程。知识发现是从数据库和中发现知识的整个过程,而数据挖掘是整个过程中的一个步骤。因为数据挖掘是知识发现整个过程中最重要的步骤,所以我们通常将知识发现和数据挖掘作为同义词使用而不加区分。数据采掘的工具目前,国外有许多研