1 / 80
文档名称:

基于数据仓库的数据挖掘方法在经济系统中的应用研究.pdf

格式:pdf   页数:80
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于数据仓库的数据挖掘方法在经济系统中的应用研究.pdf

上传人:minzo 2014/3/8 文件大小:0 KB

下载得到文件列表

基于数据仓库的数据挖掘方法在经济系统中的应用研究.pdf

文档介绍

文档介绍:北方工业大学
硕士学位论文
基于数据仓库的数据挖掘方法在经济系统中的应用研究
姓名:王晓红
申请学位级别:硕士
专业:数量经济学
指导教师:高洪深
20040420
摘要⒙畚纳杓坪凸乖焓萃诰虻募煽7⒒肪场!Vと谐∈莶挚深度、规模不断扩大,使得无论是企业、科研机构或政府部门等,尤其在经济系统中缌闶垡怠⒅と谐过去多年的时间旱积累了大量的数据。目前人们面临着迅速扩张的数据,如何有效地利用这一丰富的数据宝藏为人类服务,已经成为许多信息工作者关注的焦点之一。与日趋成熟的数据管理技术与软件工具相比,人们所依赖的数据分析工具功能,却无法有效地为决策者提供其决策支持所需要的相关知识,从而形成了一种“丰富的数据,贫乏的知识”之独特的现象,人们迫切需要有新的有效手段对这些数据进行分析,数据挖掘方法就是为满足这种需求而产生并迅速发展起来的。本文重点研究基于数据仓库的数据挖掘方法在经济系统中的应甩研究,主要针对零售业和证券市场进行数据挖掘,这两个领域的数据丰富,具有一定的代表性。本文探讨了两种算法亓9嬖颉⒕霾呤。首先进行数据采集,建立数据库,将有用的数据从数据库中提取、整合等转到一个数据仓库中,在此基础上,利用这些数据进行实证分析,从而发现一些规律性的东西。本文的工作主要体现在以下几个方面:⒙畚氖紫榷允萃诰蚬谕獾难芯肯肿唇辛朔治觯芙崃斯馐萃掘在痺、电子商务等方面的应用,指出了仍在起始阶段,绝大多数工作集中于局部算法设计,虽然有的开始进行软件开发,但还处在业务数据转移和建立数据仓库的初级阶段,进行综合的系统集成设计却寥寥无几,由于技术核心的欠缺,使得数据挖掘应用到各行业中的还不多。⒙畚亩允萃诰虻牟⒍ㄒ搴凸探辛私徊椒治觯苯岷媳疚所用到的决策树和关联规则方法,对数据挖掘的方法进行了深入探讨。提出了证券市场数据仓库的解决方案,介绍数据仓库系统的组成、信息来源、功能设计、建模及其关键技术,是本文的创新点之一。⒃谇叭搜芯康幕∩希黄屏硕跃植克惴ǖ睦砺垩芯浚萃诰蛩惴具体应用到了证券市场中,论文主要探讨了关联规则,针对证券市场的行情交易数据,看出股票的走势与价格有一定的关系,一段时间低价股上涨,一段时间中价殿上涨,一段时间高价股上涨,说明股价与涨跌之间存在一定的关系即数量关随着现代信息技术、通讯技术和计算机技术的高速发展,数据库应用的范围、
联规则,发现股票价格和股票涨跌之间的关系,同时提取一个可信度最优的规则,⒂捎诠善贝胂嗟庇谏唐罚粲诓级捅淞浚畚牟捎肁算法,该算法主要是针对布尔型变量的关联规则算法,利用行情数据,挖掘类似于“某只股票在某段时间内是上涨的,在置信度为某个值的情况下,另一只股票也随之上⒙畚慕ǹ突Ч叵倒芾砗褪萃诰蚪岷掀鹄矗刑岢鼋ㄉ栊砸饧用决策树算法将顾客进行划分,建议超市实行会员卡服务,根据不同的会员卡实行不同的优惠活动,为客户提供相应的服务。【关键词】数据挖掘、数据仓库、超市、股票、证券市场这是本文的另一个创新点。涨”的规律,这又是本文的一大特色。
甌:,;甒./·.:、瓵琾籇,.、瓼甋—..甦、、畉’
、瓺瑂,
导师签名:禹蔵笨独创性声明学位论文版权使用授权书学位论文作者签名:多噻名≯学位论文作者签名:多峨楹字日期:心甓试碌笕签字日期:吁年佃刁日签字日期:卯年彳月印日些盔堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同本学位论文作者完全了解左王些盘兰有关保留、使用学位论文的规文被查阅和借阅。本人授权友至墼盔堂可以将学位论文的全部或部分内文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得韭立王本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ学位论文作者毕业后去向:工作单位:通讯地址:电话:邮编:
第一章绪论芯勘尘凹耙庖引言随着信息技术的发展,各行各业获取数据的能力越来越强,让我们来看一些身边俯拾即是的现象;商业领域热绱笮统对大量条形码的普遍使用,使得每天都积累大量的数据;的迅猛发展,使得网上各种资源信息异常丰富;证券市场的逐步规划,使得日交易行情数据已达到几十兆,甚至几百兆。但是大量信息给人们带来方便的同时,也带来了一大堆问题:第一,信息过量难以消化;第二,信息分散难以整合;第三,信息形式不一致,难以统一。人们开始提出一个新口号“要学会抛弃信息”。面对这些“堆积如山”的信息集合,人们希望能够对其进行更高层次的分析,以便更好有效地利用这些信息。目前的数据库系统可以高效地实现