1 / 2
文档名称:

面向数据流的关联规则挖掘精确度研究的综述报告.docx

格式:docx   大小:10KB   页数:2页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

面向数据流的关联规则挖掘精确度研究的综述报告.docx

上传人:niuww 2024/4/22 文件大小:10 KB

下载得到文件列表

面向数据流的关联规则挖掘精确度研究的综述报告.docx

文档介绍

文档介绍:该【面向数据流的关联规则挖掘精确度研究的综述报告 】是由【niuww】上传分享,文档一共【2】页,该文档可以免费在线阅读,需要了解更多关于【面向数据流的关联规则挖掘精确度研究的综述报告 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。面向数据流的关联规则挖掘精确度研究的综述报告随着大数据时代的到来,数据量日益庞大,数据挖掘技术也变得越来越重要。在数据挖掘的过程中,关联规则挖掘是一种重要的数据挖掘技术。比如,超市中的购物清单就可以看作一个数据集,而关联规则挖掘则可以帮助超市找出哪些商品经常被一起购买,以便超市更好地进行商品布局和促销。然而,通常情况下,我们并不是针对静态数据集进行关联规则挖掘,而是在处理数据流时进行关联规则挖掘。面向数据流的关联规则挖掘(Stream-AR)就是指采用数据流技术进行关联规则挖掘的一种方法。Stream-AR在处理数据流时,针对新数据进行关联规则挖掘,并随着数据流的变化不断更新关联规则,因此具有良好的实时性和可扩展性。然而,由于数据流的动态性和实时性,Stream-AR还面临着一些挑战,在精确度方面尤其需要重视。因此,本文将对面向数据流的关联规则挖掘精确度相关的研究做一个综述。,支持度和置信度是评价关联规则挖掘结果的两个主要指标。其中,支持度指的是项集(或规则)在所有数据中出现的次数,而置信度指的是条件项集(或条件规则)在满足项集(或规则)中出现的比例。在数据流中,数据的动态性表现为数据分布的不断变化。因此,支持度和置信度也将不断变化。,基于滑动窗口的方法是一种常用的方法。滑动窗口指的是将数据流分为若干个大小相等的窗口,每个窗口包含了最近的一段数据。在窗口内,我们统计每个规则的出现频率并计算其支持度和置信度。随着数据流的不断“滑动”,我们可以不仅可以保证规则的实时性,还可以提高数据挖掘的效率。-AR中,精确度评估是非常重要的。评估精确度的主要方法有两种:被动评估和主动评估。被动评估指的是当数据流不断产生时,我们将数据集固定下来,通过预处理和筛选的方法挖掘出关联规则。而主动评估则是指当数据流不断产生时,我们通过在线挖掘关联规则的方法来实时检测关联规则的出现和变化。,Stream-AR的算法逐渐完善。其中,基于频繁项集发现算法的思想是比较流行的。该算法通过统计数据流中项集或者规则的出现频率,从而挖掘出频繁项集或频繁规则。同时,为了应对数据流的动态性,算法还引入了基于时间的窗口设计、动态支持度计算等技术。总之,面向数据流的关联规则挖掘是一个重要的数据挖掘任务。随着Stream-AR技术的不断发展,我们已经可以通过滑动窗口等方法有效地处理数据流的动态性。与此同时,我们也需要不断提升算法的精度,从而更好地处理这一任务。希望本文对读者对相关研究有所启发。