文档介绍:黑龙江大学
硕士学位论文
数据挖掘在统计工作中的应用研究
姓名:张敏
申请学位级别:硕士
专业:情报学·信息技术
指导教师:吴大刚
20070602
中文摘要论文从理论论证和实例研究两方面展开,试图通过对相关问题的深入研究,探索数据挖掘技术运用于政府统计的主要过程和一般分析方法。经过多年的积累,当前政府统计工作面佟笆莘岣唬畔⑵斗Α钡奈侍猓且忽视了对历史数据中隐性规律的挖掘分析,然而将基于数据仓库的数据挖掘技术运用于政府统计能够很好的解决这一问题。本文通过对统计数据特点的分析,提出了统计数据仓库建设的原则,并据此提出了基于数据仓库与数据挖掘技术的统计分析系统的实现架构、构建了便于进行分析的统计多维数据模型,并把它们应用于实证分析。在实证分析阶段,将关联及聚类算法应用于决策树算法分析的基础之上,算法的结合很好的保证了所分析指标的相关性及有效性。关键词:统计分析:数据挖掘;数据仓库;多维数据集
黑龙江大学硕士学位论文,保琣琣籇;..‘.;.—
图目录图¨‘决策树’的决策树模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图统计数据与统计信息⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图数据仓库⒋邮羰菁与独立数据集市图莶挚獾氖荽娲⑹疽馔肌图星型模式、雪花模式与事实星座模式⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图统计数据在多维数据集中的星型规范化存储模型⋯⋯⋯⋯⋯⋯⋯⋯⋯图缸游炔愦谓峁埂图基于数据挖掘的统计工作辅助分析系统架构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图工作流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图跸市┐寰弥魈獾男座吐呒峁埂图十个决策树模型的挖掘准确性评估图表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯囊览倒叵盗铰缤肌图关联分析模型的挖掘准确性评估图表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图籹“关联分桥”算法发现的规则⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图运⑾止嬖蚪凶耆〉南晗感畔ⅰ图肮亓7治觥蹦P偷囊览倒叵低肌圈】基于数据挖掘维对多维数据集的浏览⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图劾嗨惴ǚ掷喙叵低肌图三层数据仓库体系结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图萃诰蚬獭图霾呤图弱相关属性示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图掷嗵卣魇油肌图劾啾姹鹩刖劾嗟牟钩洹图聚类分析报表客户端展现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一⋯
导师签名:爱代降签字日期:沙年,月如日签字日期:纠/年乡月弓学位论文作者签名:欲钧学位论文作者签名涨缝签字日期:幻砰年岁月多移日独创性声明学位论文版权使用授权书本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得墨蕉婆太堂或其他教育机构的学位或证书而使用过的材料。本人完全了解墨蕉堑太堂有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权墨蕴江太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存、汇编本学位论文。学位论文作者毕业后去向:工作单位:通讯地址:黑龙江大学硕士学位论文电话:邮编:/、
第一章绪论第一节论文研究背景在世界走向信息化的今天,尤其是随着姆伤俜⒄梗畔⒌牟⒏新、传播、利用的节奏大大加快,快速获取信息,通过分析把信息变成有价值的情报,成为一个单位提高竞争力的重要手段。现代化国家的运作依赖统计。统计信息作为社会、经济、科技信息的主体,不仅是国家宏观调控的依据,也是企业跟踪市场动向、掌握市场规律的重要信息来源,统计信息资源也随之成为社会需求的热点。需要说明的是,在各类文献中,统计信息通常有两个含义桓鍪侵腹彝臣菩畔ⅲ春臀夜臣票ū碇贫认对应的宏观的统计,由国家统计局和各级、各类部门组成,这可以看作是宏观的统计信息;另一个含义是企业、行业、民间完成的部门数据处理、统计信息生成、维护以及辅助决策等任务的统计任务,这可以看作是微观的统计信息。在本文中所论述的统计信息指的是第一类宏观统计信息,即政府的官方统计信息。统计部门是政府的一个重要职能部门,负责为政府提供宏观决策的数据依据。统计部门掌握着大量丰富、权威性的信息,这是其他部门所无法比拟的;统计覆盖社会经济发展的各个方面,具有纵横交错、密切结合的统计信息传输网络,这也是其他部门所无法比拟的。以计算机为龙头的信息技术革命,正在迅速地改变着人们的生活方式和生活习惯,使得迅速的处理数据、传输数据、缩短信息的流动时问、提高决策的效率和可靠性成为可能和现实。所以,利用好日臻完善的信息技术合理开发统计信息,能更好的促进我国信息产业发展,使统计工作在建立社会主义市场经济体制、建设现代化过程中全面发挥其应有的职能作用。经过几十年的发展,