文档介绍:独创声ⅲ喝缑挥衅渌枰L乇鹕鞯模纠缚煽或其他教育机构的学明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含位或证书使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签字日期:为获得导师签字月暝氯学位论文作者签名日▲
摘要多领域已有研究,但在公安工作的研究中尚处于空白,如何将数据挖掘技术应用罪,同时大案要案所占比例也有增多。这种情况下,采用数据挖掘技术发现最新决的问题,如不能对新犯罪行为产生规则,容易忽略所占比例较少但危害性很大对数据挖掘技术在公安工作中存在的问题进行了分析与探讨;掘算法对新犯罪的重视情况。提出了基于敏感性的呕惴ǎ呕蟮算法提高了算法的效率,并且通过模型证明对新犯罪项目是敏感的。分析了传统的惴ㄔ诜缸镄形7治鲋写嬖诘奈侍猓岢隽嘶谧ḿ数据挖掘技术是近年来数据库和人工智能领域研究的热点课题,目前在很于公安工作,是本文研究的重点。当前,随着社会政治、经济和科学技术的高速发展,现代犯罪行为表现出了速度化、智能化、高科技化的特点。从犯罪整体走势看,建国以来,我幽出现过五次犯罪高峰,尤其是改革开放以来出现的第五次犯罪高峰发案数量明昆上升,而且伴随着每一次犯罪浪潮都有新的罪种出现,经济犯罪、金融犯罪、智能犯罪迅速崛起,上升速度非常之快,远远超过了恶性的、原始的、人的本能的犯规则并及时将其应用于公安人员的日常警务工作,以提高执法效率与快速反应能力、及时的预防与打击犯罪行为,成为公安工作中急需解决的问题。但目前传统的分类规则惴ㄓ刖霾呤鱅算法在公安工作中的应用都存在着不能解的大案要案的相关规则等,针对于这种情况,本文所作的主要工作是提出了算法的改进,并通过模型进行了验证。本文所做的主要工作有以下四点:针对新犯罪行为的不断出现,提出了敏感性问题,用来衡量关联规则挖针对在传统的惴ㄖ校淙恢匾5急壤仙俚南钅咳菀妆缓略的问题,提出了加权的呕惴ǎ苑⑾执蟀敢0傅墓嬖颉系数腎优化算法,为决策树在公安工作中的应用提供了新的思路。惴关键词:数据挖掘关联规则决策树山东师范大学硕士毕业论文
,瑆琾,,瓵琲琱瑃甌,猽瓼,.,,,琣.:山东师范大学硕士毕业论文甀—.甋琲,.
甌,篸山东师范大学硕士毕业论文瓵瑂瓵,.瑂甌甌:.
第一章绪论数据挖掘技术人用信息技术生产和搜索数据的能力不断提高,近年来随着数据库和计算机而且不能获得数据属性之间的内在关系和隐含的信息,即不能获得重要的有价值的知识。这样,海量数据的生成和搜索技术与拙劣的数据分析方法之间形成了鲜使消耗大量财力与物力收集与整理得到的宝贵资源一数据得以充分利用。数据挖开的第一届恃趸嵋樯险叫纬傻摹辏诩幽么笳倏A说谝唤知识发现和数据挖掘国际会议,由于数据库中的“数据”被形象比喻为“矿床”,“数据挖掘”一词很快流传开来,并逐渐形成一个热门研究方向。麻省理工学院渤剖菘庵械闹J斗⑾篕当前人们生活在一个网络化的时代,通信、计算机和网络技术正改变着整个人类和社会,如果用芯片集成度来衡量微电子技术、用砥骼春饬考扑慊技术,用信道传输速度来衡量通信技术,那么摩尔定律告诉人们:它们都是以每个月翻乃俣仍谠龀ぃ庖皇仆芬丫至耸嗄辍K孀攀贝姆⒄梗网络的广泛应用,加上使用先进的自动数据生成和采集工具,人们所拥有的数据量急剧增大,面对“堆积如山”的数据集合,无论在时间意义上还是在空间意义上,传统的数据分析手段都难以应付,人们无法有效地理解并使用这些数据,由此导致越来越严重的“数据灾难”,造成大量数据资源的浪费。传统的数据分析方法缤臣,只能获得这些数据的表层信息,很难对数据进行深层次的处理,明的对照,这需要新的技术来“智能地”和“自动地”分析海量的原始数据,以,简称椭J斗⑾简称应运而生,它们的出现为自动和智能地把海量数据转化为有用的信息基于数据库的知识发现淮首钤缡窃月于美国底特律市召的《科技评论》杂志提出来的未来甓匀死嗖卮笥跋斓蠹际踔校笆侵复哟笮褪菘饣蚴莶挚庵刑崛∪嗣歉行巳さ闹掘和知识提供了手段。掘挖掘”居第三位。数据挖掘,山东师范大学硕士毕业论文
识,这些知识是隐含的、事先未知而又潜在有用的信息,提取的知识一般可表示数据总结的目的是对数据进行浓缩,给出它的紧凑描述。传统的也是最简单的数据总结方法是计算出数据库的各个字段上的求和值、平均值、方差值等统计度来讨论数据总结。数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。由于数据库上的数据或对象所包含的信息,对于数据挖掘而言总是最原始、基本的信息馐俏A瞬灰怕┤魏慰赡苡杏玫氖菪畔,人们有时希望的前提是数据分析。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作,这类操作的计算量特别大。