1 / 8
文档名称:

面向数据挖掘应用的商业数据质量分析研究.doc

格式:doc   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

面向数据挖掘应用的商业数据质量分析研究.doc

上传人:164922429 2014/3/9 文件大小:0 KB

下载得到文件列表

面向数据挖掘应用的商业数据质量分析研究.doc

文档介绍

文档介绍:面向数据挖掘应用的商业数据质量分析研究#封毅,潘栋,罗晨*510152025(浙江工商大学计算机与信息工程学院,杭州310018)摘要:本文旨在探索面向数据挖掘应用的商业数据质量问题。首先,从数据挖掘的视角,分析了商业数据的特点及其对数据挖掘的影响。随后,根据已有的数据质量维度,结合商业数据的特点和生命周期,提出了适用于商业数据挖掘应用的商业数据质量维度体系,包含6个阶段8个维度。最后,以当当网、亚马逊、京东商城等典型电子商务网站的图书数据为实例分析对象,结合商业数据质量维度体系,重点分析了三家电商网站在数据规范、完整性、准确性方面的数据质量问题。实例分析结果显示当前电商网站的数据质量还存在一定问题,需在数据挖掘之前进行评估和解决。关键词:数据挖掘;数据质量;商业数据质量中图分类号:TP391BusinessdataqualityanalysisfordataminingapplicationsFENGYi,PanDong,LUOChen(puterScience&InformationEngineering,ZhejiangGongshangUniversity,Hangzhou310018)Abstract:,,aframeworkofbusinessdataqualitydimensionsfordataminingisprovided,,acasestudyofbusinessdataqualityanalysisisconductedonbookdatainB2Cwebsitesdangdang,Amazon,and360buy,pleteness,,:Datamining;Dataquality;Businessdataquality300引言近年来,数据挖掘可靠性已成为数据挖掘领域的一项新兴的研究主题。随着数据挖掘技术的飞速发展和相关研究的逐步深入,分析者已不再像以前那样陷于海量数据却苦于没有方法入手,而是由于数据质量情况复杂、产生的模式和知识太多、或者缺少有效评估方法,不3540知道自己所实施的知识发现过程有多可靠,所产生的模式和知识是否可靠。这就给知识发现界提出了一个重要的问题,即在什么条件下知识发现是可靠的,或者说在什么条件下所发现的知识是可靠的。数据质量是影响数据挖掘可靠性的一大关键因素。对于数据挖掘来讲,无论应用于哪个领域,其核心目标都在于从相