1 / 15
文档名称:

Apriori算法在教育领域地应用.doc

格式:doc   大小:134KB   页数:15页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Apriori算法在教育领域地应用.doc

上传人:beny00001 2019/9/12 文件大小:134 KB

下载得到文件列表

Apriori算法在教育领域地应用.doc

文档介绍

文档介绍:-TIDS算法在教育领域的应用摘要: 数据挖掘技术是应用一系列技术从大型数据库中提取出出隐含的、以前未知的、具有潜在应用价值的信息,它是知识发现(KDD)过程中最核心的部分。而关联规则的挖掘是数据挖掘的一项重要的任务,用以发现大量数据项集之间的相关联系。Apriori算法在关联规则挖掘中最具代表与影响的一种算法。针对它需要重复的扫描数据库以确定各个候选项集的支持度计数和产生大量候选项集的缺陷,设计出了新的算法Aprior-TID(SransactionIdentifier)算法。本文还将探讨这个算法落实到教育相关领域上的两个具体应用--教育管理决策系统和招生管理系统。关键字:Aprior-TIDS;数据挖掘;教育决策;招生管理;关联规则; 自从1989年8月在第11届国际联合人工会议上首次提出知识发现这一概念以来,研究者们给KDD下了很多定义。随着KDD研究的不断深入,对KDD的定义也在不断地改进,以下是目前对KDD比较公认定义:KDD是从大量繁多的数据中提取出可信的、新颖的、有效的并能被人理解的模式的处理过程,这种处理过程是非平凡的过程[1]。 KDD是一个多步骤的过程,并且根据实际需要这些步骤可能要多次反复,其主要步骤如图1-1所示::了解KDD相关领域的有关情况,熟悉有关的背景知识并了解用户需求。:从用户需求出发由数据库中提取出于本次KDD过程相关的数据,此过程主要是对数据库中的原始资源进行提取。:初步处理上一步所选择出的数据,包括对数据的完整性与一致性进行检查,对数据中出现的噪声进行判断并加以去除,对错误和丢失的数据进行修补。:对经过预处理数据的数据项,主要通过投影的方式或一些相关的数据库操作减少数据量。:根据用户需求确定KDD的结果属于哪类知识,这是作为选择知识发现算法的依据。:根据上一步所得结果选择适合的算法、模型和参数。:利用所选算法,从经过初步处理的数据中提取出用户所需的知识。要求其结果要简单易懂,一般都是一些常用的表达式或产生式。:对发现的模式进行解释。:将发现的数据以用户易于理解的方式呈现,也包含对知识一致性的检查。图1-1KDD过程 从上述对KDD过程的描述可以得出结论:数据挖掘只是知识发现过程中的一个步骤,但它是知识发现过程中最重要的一个步骤。它主要是利用知识发现算法,从数据中发现出有关的知识或模式。。 数据挖掘(Datamining,简称DM),就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘过程一般由确定挖掘对象、数据准备、模型建立、数据挖掘、结果分析表述和挖掘应用这几个主要阶段组成。数据挖掘可以描述为这几个阶段的反复过程[2]。首先确定目标、明确数据挖掘任务。(1)数据准备数据准备阶段又可进一步分成四个子步骤数据集成、数据选择、数据预处理和数据转换。A、数据集成。数据集成是将多文件或多数据库运行环境中的数据进行合并处理,解决语义模糊性,处理数据中的遗漏和清洗数据等。B、数据选择。数据选择指为数据挖掘目标搜集和选择有关的数据,这包括不同格式数据的转换以及不同部门数据的统一和汇总。数据选择的目的是辨别出需要分析的数据集和,缩小处理范围,提高数据挖掘的质量。C、数据预处理。数据预处理是对数据进行清理和充实等工作。数据库中重要的数据是准确的,不重要的数据可能存在污染。预处理就是为了克服目前数据挖掘工具的局限性。D、数据转换。数据转换的一个重要工作就是对数据进行编码。数据库中字段属性的不同取值转换成数码形式经有利于搜索。(2)数据挖掘这个阶段将进行实际的挖掘操作,即利用机器学习、统计分析等方法,从数据库中发现有用的模式或知识这里模式是浓缩数据的信息形式,如精炼数据库、表格、产生式规则、决策树、神经网络的权值等。A、选择数据挖掘方法。如统计分析、机器学习、模式识别方法和人工神经元方法等。B、选择数据挖掘算法。选择用来查找模式或符合数据的模型的算法,确定合适的模型和参数。另外,数据挖掘方法必须和目标相匹配。C、数据挖掘。查找感兴趣的模式。模式一般表示为一种特殊的形式或一套表达方式,如关联规则,分类规则或分类树,回归结构和聚类集等。除了选择合适的挖掘算法外,其余的一切工作都可自动完成。(3)数据挖掘结果分析表述和挖掘应用A、结果表达。尽量直观的表示挖掘结果,便于用户理解和使用,可利用可视化方法表示为图表等形式。B、结果评价。筛选和评价挖掘结果中的

最近更新

2025年西安市高职单招综合素质考前押题试题及.. 11页

2025年苏教版6年级数学上册《补充习题》参考答.. 66页

2025年职业生涯规划的阶段和方式及实施策略 9页

2025年网络营销实训报告总结9篇 16页

2025年网店运营1+X理论知识考核试题及答案 24页

2025年统计学试题库与答案 13页

2025年统一帕金森病评定量表(UPDRS 3.0版) 9页

2025年水解弹性蛋白项目合作计划书 59页

2025年电商项目合作计划书 64页

2025年管道护理理论知识考核题库与答案 11页

2025年秋国开《移动服务接口开发技术》形考任.. 5页

2025年福建电工基础考试题及答案电工技师考试.. 19页

2025年社区题库简答和论述的重点题 9页

2025年研究报告课题古诗词鉴赏 19页

2025年眼科医院客服述职报告范文(精选8篇) 9页

妇产科护理学重点 6页

2025年电工证工作年限承诺书 8页

2025年电大小学教育专业本科毕业论文 12页

办公室文员工作总结二篇 5页

2025幼儿园教师年度考核个人工作总结(31篇).. 81页

受戒申请表格 3页

2024年保险公司安全生产自查自纠工作总结(2篇.. 8页

罗振宇《终身学习》读书笔记 5页

2024年江西财经职业学院单招职业适应性测试题.. 59页

康复治疗技术呼吸肌训练ppt 21页

高压旋喷桩桩安全交底 6页

乔格横剪线安全操作规程 1页

康复理疗中心康复师考核评分表(月度) 1页

毕业设计 斜三通注塑模 40页

面相十二宫 PPT课件 50页