1 / 5
文档名称:

万方数据库免费论文数据挖掘 论文.doc

格式:doc   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

万方数据库免费论文数据挖掘 论文.doc

上传人:1954311756 2014/4/25 文件大小:0 KB

下载得到文件列表

万方数据库免费论文数据挖掘 论文.doc

文档介绍

文档介绍:万方数据库免费论文数据挖掘论文
数据挖掘在高校资产管理中的应用
[摘要] 进行高校资产数据挖掘与分析研究,能更好地为高校管理、高校决策提供科学依据。本文分析了高校资产管理的现状与特点,构建了高校资产数据仓库雪花模型,挖掘出高校资产管理指标之间的关联规则,并对该数据挖掘模型进行评价,在实际应用中取得了良好效果。
[关键词] 高校资产;数据仓库;数据挖掘;雪花模型;关联规则
(2011)05- 0026- 03
1概述
高校资产信息管理系统中的数据客观记录了高校所有资产的历史情况和现状,同时也隐含着各种资产的特点,蕴藏着学校的发展规律和趋势。然而现阶段高校各部门一般采用不同的数据库,数据整合困难,无法实现不同系统跨平台信息的共享与交互,无法实现面向主题的数据分析,从而无法更多更好地利用数据资源。为了充分利用这些积累的记录信息,从中发现有用的知识,获得潜在的规律,为高校资产管理和决策提供科学参考,需要建立一个分析决策系统。而实现分析决策系统的主要技术就是数据仓库和数据挖掘。
数据挖掘是指从大量数据中提取或发现知识[1]。数据挖掘通过一些模型和智能方法,从大量数据中提取、识别用户真正感兴趣的、新颖的、潜在有用的模式,提供给用户作为决策的依据和参考。
数据仓库与数据挖掘技术已被广泛应用于商业领域,但用于高校资产管理领域的却很少。本文通过构建高校资产数据仓库模型,对资产管理指标的相关属性进行分析,通过数据挖掘得出了资产管理指标之间存在的一些强关联规则,各规则的信任度均达到70%以上。
2高校资产数据仓库逻辑模型
数据仓库多维数据集能对数据仓库中的所有数据提供统一的和集成的视图,可作为传统报表、联机分析处理和数据挖掘的基础。数据仓库的逻辑模型包括事实表和维度表,事实表描述挖掘主题包涵的多个角度,维度表则从不同角度描述挖掘主题的相关数据[2]。结合高校资产挖掘主题与资产信息数据的特点,高校资产数据仓库的逻辑模型采用了雪花模型结构,如图1所示。“资产数据事实表”与“部门表”、“资产编码表”、“资产分级表”、“时间表”4个主维度表关联,“部门表”、“资产编码表”和“资产分级表”还分别有“上级部门表”、“资产类别表”和“资产指标表”3个二级维度表,其中“资产类别表”还有三级维度表“资产大类表”。建立这种多级维度表不但可以降低数据仓库的数据冗余度,减少数据量,保证数据一致性,还有利于改变数据粒度,实现灵活粒度的数据挖掘。
数据挖掘如果建立在原始数据水平或较低的维层次上,则此时数据粒度小,挖掘速度慢,挖掘得到的规则繁杂,难以理解;如果数据从低维层次抽象到高维层次,对较高维层次数据进行挖掘,则此时数据粒度大,挖掘速度快,得到的规则泛化程度高,便于宏观理解。因此通常在高维层次上进行挖掘,必要时再进行较低维层次上的挖掘[3]。
3数据属性归约及取值

高校的资产数据按教育部规定分为16类,对这些资产进行管理非常繁杂,根据实际我们选取以下4个管理指标以利于资产数据挖掘:
(1)资产购建价值,用A表示。它是购买或建造资产的原值。理论上同类资产价值高的要比价值低的使用寿命长。
(2)资产剩余使用年限率,用B表示。每种资产都有一定的使用年限,使用中每年提取折旧,当到达规定的使用年限后该资产一般只剩下很少的残值,