文档介绍:关联规则挖掘在图书借阅数据处理中的应用摘要高校图书馆作为高校师生的一个重要知识库,馆内藏书所涉及的领域非常广泛;图书馆每年购入新书,因此图书馆藏书量也在不断增多。师生们要在众多的书籍中找到自己需要的相关图书是一件非常困难的事情。因此,快速有效地优化藏书布局对师生的学习与研究显得尤为重要。本课题的目标就是运用数据挖掘中的关联规则方法,从读者的历史借阅数据中快速有效地挖掘出借阅书籍之间的关联信息,来帮助管理员优化藏书布局。本文首先阐述了数据挖掘的理论基础,对关联规则数据挖掘中的一些经典算法进行了系统的分析和总结;然后根据要求将图书馆历史借阅数据进行数据预处理,包括数据的导入和提取、事务数据库的建立;在此基础上将新的关联规则挖掘算法惴ㄔ擞玫绞挛袷菘猓诰虺鼋柙氖榧涞墓亓9嬖颉J验结果显示,该算法在效率上优于其它算法。由于图书馆借阅数据每日有更新,数据库不断增大,并且根据需要的关联程度不同,最小支持度也有变化。为了使图书摆放能够尽快适应师生借阅需求,需要不断地更新挖掘结果。若利用前面的挖掘算法鏜等匦峦诰蛘数据库,将会很费时间,而且以前挖掘出来的信息也被浪费。为此,本文提出运用惴ɡ唇饩鍪菘夂妥钚≈С侄韧北浠钡淖酆细峦诰蜃畲笃繁项目集的问题,从而可避免每年对旧数据的重复挖掘。关键词:数据挖掘;关联规则;最大频繁项目集;
知识水坝***@pologoogle为您整理
姗缸,,, .鯨甋;..,琲,瓻甀瞐.;;,.’.瑃,:
知识水坝***@pologoogle为您整理
导师签字:。壹婶辄签字日期:怖岁月日学位论文作者签名:吕意若签字日期:矽略年岁月日箩月岁/日学位论文版权使用授权书曰七甚独创声明垫遗查基他霞墓鳖型直明煎:奎拦亘窒蚱渌逃沟难换蛑な槭、力本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含未获得用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ学位论文作者签名:签字日期:矽晒年弧痮,
髀数据挖掘的发展历史及国内外研究现状课题的背景和意义信息、物质、能源是人类社会发展的三大基础性资源,其中信息是信息时代最重要的资源。科技的进步,特别是信息产业的发展,预示着人类正在大踏步进入信息时代。信息对人类社会的生存和发展起着越来越重要的作用。随着时代的进步,知识的综合性越来越强,社会对学生知识的掌握要求也随之提高。老师上课授给的知识已不能满足学生的要求,此时,学校图书馆作为学校师生获取知识的源泉,起着举足轻重的作用。图书馆藏书的类别和摆放格局直接影响高校师生学习研究的知识方向。图书馆每年购入新书,因此图书馆藏书量也在不断增多。师生们要在众多的书籍中找到自己需要的相关图书是一件非常困难的事情。因而及时快速地获取高校师生的需求,进而对图书馆藏书及摆放格局进行合理调整以利于师生借阅是一件非常有意义的事情。数据挖掘作为需求分析的一种新技术,能很好地从历史数据中分析出读者的需求。首先根据读者的行为特性与阅读习惯等进行藏书建设,从中分析和发掘藏书结构的优缺点;在读者群细分后,开始进行针对性的调研分析活动,从大量数据中挖掘得到读者需求的内在模式;然后对大量的读者与阅读行为进行跟踪与再分析、再预测,并对藏书结构的效果进行评估,从而做出相应的调整。图书的借阅数据每年都在更新,随着历史数据库越来越大,需要不断地进行图书历史借阅数据关联规则挖掘以及时更新图书间的关联规则。重复地挖掘老的借阅数据势必成为数据挖掘工作的一个重要负担,因此利用已有关联规则进行总的数据挖掘以减轻挖掘任务成为提高挖掘效率的重要方法。.萃诰蚍⒄估数据挖掘【渴且桓龆嘌Э屏煊颍畛醭鱿钟兰甏笃冢甏了突飞猛进的发展。自从数据库中发现知识】一词首次出现在年戮傩械牡旃柿:先斯ぶ悄苎趸嵋橐岳础裎V梗擅拦斯ぶ关联规则挖掘在图书借阅数据处理中的应用
课题研究目的、数据来源、处理工具能协会主办的恃刑只嵋丫倏A危婺S稍吹淖ㄌ馓致刍岱展到国际学术大会,人数由说匠耍芯恐氐阋仓鸾ゴ臃⑾址椒ㄗ向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。峥氏仍瓿霭媪薑技术专刊。年,亚太地区在北京召开的第三届嵋槭盏篇论文,空前热烈。并行计算、计算机网络和信息工程等