文档介绍:密级: 学校代码:10075
分类号: 学号:20091402
管理学硕士学位论文
一般二元关系下基于条件信息熵的粗糙
集属性约简
学位申请人:于迎春
指导教师:任志波副教授
申请学位级别:管理学硕士
学科专业:管理科学与工程
授予学位单位:河北大学
答辩日期:二○一二年五月
Classified Index: CODE: 10075
: NO: 20091402
A Dissertation for the Degree of M. Management
Attribute Reduction of Rough Set Based
on Conditional Information Entropy in
General Binary Relation
Candidate: Yu Yingchun
Supervisor: Associate ZhiBo
Specialty: Management Science &
Engineering
Academic Degree Applied for: Master of Management
Date of Oral Examination: May, 2012
University: Hebei University
摘要
摘要
信息技术的高速发展加速了信息全球化的到来,以信息手段增强本身的竞争优势已
成为许多企业采取的手段,因此在经营过程中积累了大量的数据,如何处理分析这些数
据并从中得到有价值的信息是数据挖掘中研究的一个重要的课题。粗糙集理论是数据挖
掘中的一个重要工具,主要处理具有不确定性和不完备的数据知识。该理论是由Pawlak
提出的,经典粗糙集理论的核心概念是基于等价关系的上近似和下近似,在这两个概念
的基础上可以将信息系统潜在的知识表示成决策规则的形式。由于等价关系的约束条件
过于苛刻,限制了经典粗糙集理论在复杂的信息系统中的应用,因此许多研究者在等价
关系的基础上将约束条件放宽,扩展为相容关系、相似关系和一般的二元关系。
信息熵概念的提出是为了度量事件的不确定性程度,其本质是使用确切的数值来度
量知识的不确定性。因此,通过建立粗糙集理论与信息熵之间的关系,必然可以对知识
的粗糙性做出更精确的度量,从而更加精确的对粗糙集进行属性约简,得到有用的规则。
很多研究者在把信息熵理论应用到经典粗糙集的知识粗糙度的度量及属性约简方
面做了大量的工作。近年来,也有一部分研究者将等价关系扩展成为一般的二元关系,
并将信息熵理论应用其中。但是基于一般二元关系的信息熵的应用还只是停留在对于知
识的粗糙性的研究层面上,因此本文在前人的研究成果的基础上,将信息熵理论应用到
了一般二元关系下粗糙集的属性约简上面,为这一理论应用拓宽了研究的道路。
本文在上述研究的基础上,提出了基于一般二元关系的知识的条件信息熵的定义及
性质,在基于等价关系的条件信息熵的概念描述的基础上证明了相关的一些定理。利用
一般二元关系下知识的条件信息熵的特点,在现有的约简算法的基础上,提出了一种粗
糙集属性约简的算法并进行了改进,最后将算法应用到了电厂数据的处理中,证实了改
进后算法的先进性。
关键词粗糙集信息熵条件信息熵属性约简
I
Abstract
Abstract
The rapid development of information technology to accelerate the advent of
globalization of information, using information tools to enhance petitive advantage has
e the means of many enterprises to adopt, a large amount of data accumulated in the
course of business, how to deal with the analysis of these data and gain valuablethe
information is an important research topic in data mining. Rough set theory is an important