1 / 6
文档名称:

数据挖掘技术在科研机构情报分析工作中的应用研究.doc

格式:doc   大小:15KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

文档介绍:数据挖掘技术在科研机构情报分析工作中的应用研究

摘 要 在我国的科研情报服务中,对数据的挖掘技术还存在很多的问题,本文分析大数据对信息的挖掘功能以及目前情报分析中存在的问题,并给出了相关的解决方案。
关键词 数据挖掘;数据挖掘技术在科研机构情报分析工作中的应用研究

摘 要 在我国的科研情报服务中,对数据的挖掘技术还存在很多的问题,本文分析大数据对信息的挖掘功能以及目前情报分析中存在的问题,并给出了相关的解决方案。
关键词 数据挖掘;科研机构;情报分析
引言
在当今信息时代,信息技术被广泛应用在企业、科研院所和政府部门等机构,随着各项工作的开展,积累了海量的、不同形式的数据资料。而在科研机构开展科研活动过程中,需要通过大数据的技术手段,对这些隐含着各种各样有用的信息数据进行采集、分析、处理、存储等工作,将其转化为有价值的信息,为决策服务,并指导科研人员研发更多的产品,不断提升技术,提升科研成果的价值和科研机构的影响力。基于这种需求,数据挖掘技术开始出现并得到了广泛的关注和应用。
1 数据挖掘技术概述
1.1 数据挖掘的定义
数据挖掘(Data Mining),也叫数据开采,数据采掘等,是按照既定的业务目标从海量数据中提取出潜在、有效并能被人理解的模式的高级处理过程[1]。数据挖掘在科研领域也称为数据库中的知识发现,是一个利用各种算法和工具在海量数据中发现有效知识的过程。在科研机构中数据挖掘基于的环境是大型科技文献数据库和专利数据库,它应用的对象是大规模数据集,处理的数据往往以GB、TB计,甚至更大。
1.2 数据挖掘技术概述
数据挖掘技术主要包含统计学、数据库、人工智能等专业学科领域。数据挖掘技术有数据库、対象、任务、方法与技术、应用等几类。其中数据库技术包含:关系、历史、空间、模糊四种数据挖掘类型;数据挖掘对象包含:文本、多媒体、Web数据挖掘三类;按数据挖掘任务分类包含:关联分析、时序模式聚类、分类、偏差检测、预测等技术;按数据挖掘的方法和技术分类包含:归纳学习、仿生物技术、统计分析、公式发现、模糊数学等类别。
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。目前,数据挖掘技术有两种主要的类型,一种是对象类型,另一种是功能型。前者主要是针对多媒体数据、时间序列数据、空间数据。后者主要有描述和预测的模式,描述模式分为、序列、聚类、关联模式,预测模式主要时间序列模式、分类模式、回归模式等。
1.3 数据挖掘技术研究现状
数据挖掘技术近年的研究方向主要集中在基础理论研究、大数据挖掘研究、图挖掘研究及社交网络分析等领域。在基础理论研究中,大多是根据实际的应用改进或提出新的分类、算法,以新技术解决现实问题;大数据挖掘是当前的研究热点,其研究领域的进展体现在可扩展性算法、并行性算法、分布式算法等几个方面;图挖掘研究主要集中在图模式挖掘和基于图的学习算法研究方面;社交网络分析研究主要集中在网络结构分析、群体行为和影响力、建模以及网络信息传播分析四个方面,近几年情报研究人员在社交网络研究方面开展的研究比较多,例如社交推荐、社交搜素等。
2

分享好友

预览全文

数据挖掘技术在科研机构情报分析工作中的应用研究.doc

上传人:宝钗文档 2022/5/18 文件大小:15 KB

下载得到文件列表

数据挖掘技术在科研机构情报分析工作中的应用研究.doc

相关文档