1 / 9
文档名称:

大数据挖掘:概念与技术.doc

格式:doc   大小:32KB   页数:9页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据挖掘:概念与技术.doc

上传人:beny00011 2022/1/14 文件大小:32 KB

下载得到文件列表

大数据挖掘:概念与技术.doc

文档介绍

文档介绍:word
word
1 / 9
word
简介
本书完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以与重要应用领域。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。
序言
word
word
4 / 9
word
社会的计算机化显著地增强了我们产生和收集数据的能力。大量数据从我们生活的每 个角落涌出。存储的或瞬态的数据的爆炸性增长已激起对新技术和自动工具的需求,以帮助我们智能地将海量数据转换成有用的信息和知识。这导致称做数据挖掘的 一个计算机科学前沿学科的产生,这是一个充满希望和欣欣向荣并具有广泛应用的学科。数据挖掘通常又称为数据中的知识发现〔KDD〕,是自动地或方便地提取 代表知识的模式;这些模式隐藏在大型数据库、数据仓库、Web、其他大量信息库或数据流中。  本书考察知识发现和数据挖掘的根本概念和技术。作 为一个多学科领域,数据挖掘从多个学科汲取营养。这些学科包括统计学、机器学****模式识别、数据库技术、信息检索、网络科学、知识库系统、人工智能、高性 能计算和数据可视化。我们提供发现隐藏在大型数据集中的模式的技术,关注可行性、有用性、有效性和可伸缩性问题。因此,本书不打算作为数据库系统、机器学****统计学或其他某领域的导论,尽管我们确实提供了这些领域的必要背景材料,以便读者理解它们各自在数据挖掘中的作用。本书是对数据挖掘的全面介绍。对于 计算科学的学生、应用开发人员、行业专业人员以与涉与以上列举的学科的研究人员,本书应当是有用的。  数据挖掘出现于20世纪80年代后 期,20世纪90年代有了突飞猛进的开展,并可望在新千年继续繁荣。本书全面展示该领域,介绍有趣的数据挖掘技术和系统,并讨论数据挖掘的应用和研究方 向。写本书的重要动机是需要建立一个学****数据挖掘的有组织的框架——由于这个快速开展领域的多学科特点,这是一项具有挑战性的任务。我们希望本书有助于具 有不同背景和经验的人交换关于数据挖掘的见解,为进一步促进这个令人激动的、不断开展的领域的成长做出贡献。  本书的组织  自本书第 1版、第2版出版以来,数据挖掘领域已经取得了重大进展,开发出了许多新的数据挖掘方法、系统和应用,特别是对于处理包括信息网络、图、复杂结构和数据 流,以与文本、Web、多媒体、时间序列、时间空间数据在内的新的数据类型。这种快速开展、新技术不断涌现使得在一本书中涵盖整个领域的广泛内容非常困 难。因此,我们决定与其继续扩大本书的涵盖面,还不如让本书以足够的广度和深度涵盖该领域的核心内容,而把复杂数据类型的处理留给另一本即将面世的书。   第3版对本书的前两版做了全面修订,加强和重新组织了全书的技术内容,显著地扩大和加强处理一般数据类型挖掘的核心技术。第2版中讨论特定主题的章节 〔例如,数据预处理、频繁模式挖掘、分类和聚类〕在这一版都被扩大,每章都分成两章。对于这些主题,一章囊括根本概念和技术,而另一章提供高级概