文档介绍:山东大学
硕士学位论文
粗糙集理论在数据库中的应用研究
姓名:霍雯
申请学位级别:硕士
专业:计算机软件与理论
指导教师:张世栋
20090405
摘要山东大学硕士学位论文粗糙集理论是一种处理含糊和不确定性问题的新型数学工具,已广泛应用于机器学习、决策分析、知识发现、专家系统、决策支持系统、模式识别、模糊控制等领域。目前粗糙集理论在数据库中的应用主要集中在两个方面:一个是数据库中的知识发现,简称,另一个是粗糙关系数据库模型虺芌。知识约简殖剖粜栽技是写植诩砺鄞淼闹饕N侍猓钟械基于区分矩阵和区分函数的知识约简算法的时间复杂度一般为川,其中是论域懈鎏宓氖浚琁是属性个数,当数据量很大时,这些算法的可行性就面临巨大挑战,这些算法的低效性在一定程度上也限制了粗糙集理论的广泛应用,因此寻求高效的知识约简算法具有重要的意义。粗糙关系数据库模型是粗糙集理论和经典关系数据库模型相结合的产物,目前国内外学者对的研究主要集中在粗糙关系操作,粗糙关系查询,粗糙函数依赖,粗糙关系中的信息熵等研究上,但是所有的文献都是就的某一方面进行论述,并且很多概念定义得不够规范准确,因而如果能从粗糙关系数据结构、粗糙关系操作、粗糙关系完整性约束、粗糙关系规范化四个方面,构建一个完善的粗糙关系数据库的数学模型,必将对今后真正实现并应用推广这个模型,奠定完备坚实的理论基础。本文将研究工作放在:寻求高效可行的知识约简算法方面,和从全局角度对粗糙关系数据库模型给予一个比较完整规范的描述方面,主要创新成果如下:⑻岢隽艘恢只诨旨酉傅男碌闹J对技蚨ㄒ澹⒅っ髁怂途涞幕于正区域的知识约简定义等价,利用这个定义求解知识约简能够减少计算量。⒁肓艘恢忠恢露壤炊攘烤霾弑碇刑跫粜远跃霾呤粜缘闹匾P裕源一致度作为知识约简算法的启发信息以缩小搜索空间,并证明了条件属性的一致度越小,其对决策的重要性就越小,从而说明了以此一致度作为启发信息是合理的。
⋯东大学硕士学位论文关键词:粗糙集;数据库中的知识发现;知识约简:决策表;粗糙关系数据库。⒃趌、幕∩仙杓屏艘恢只诨旨酉负鸵恢露鹊钠舴⑹街J对技蛩法,此算法的时间复杂度为渲蠭L跫粜愿鍪琹为论域懈鎏的数目,低于现有的经典知识约简算法,而且计算量较小。⒙氏忍岢隽舜哟植诠叵凳萁峁埂⒋植诠叵挡僮鳌⒋植诠叵低暾栽际粗糙关系规范化这四个方面,建立一个完整的粗糙关系数据库模型;⑻岢隽舜植诠叵低暾栽际酝晟拼植诠叵凳菘饽P投圆煌耆畔的处理能力:⑻岢隽舜植诠叵倒娣痘砺奂跋嘤Φ墓娣痘惴ǎ越饩鲈诖植诠叵凳据库逻辑设计中如何构造一个好的数据库模式问题。
山东大学硕士学位论文ⅱ,..瑃、Ⅳ,,篛瑆琲瑃瓵簍,琲簅
;ù,鮰:甌瓵;.瑃甌疭瓸琣瑃簍,,籏籖
论文作者签名:二逖导师签原创性声明关于学位论文使用授权的声明原创性声明和关于论文使用授权的说明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。本人完全了解山东大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。C苈畚脑诮饷芎笥ψ袷卮斯娑论文作者签名:
第一章引言山东大学硕士学位论文粗糙集理论的产生背景与发展研究现状经典逻辑中只有真、假二值,但在现实世界中广泛存在含糊现象,其逻辑值不是非真即假,而是介于两者之间。因此,早在年,逻辑学家瓼就提出了含糊挛腣拍睿帽呓缦咔蚶幢硎灸切┘炔荒鼙环掷嘤谀掣集合又不能被分类于该集合的补集的元素;世纪年代初,⑽腇,但它是不可计算的,没有给出数学公式计算边界线区域中的含糊元素个数:年,波兰华沙理工大学的教授提出了粗糙集,其主要思想是通过全域上的等价关系来定义全域上某个子集的上、下近似,用该子集的下近似来表示全域中那些能被分类于该子集的元素,而用该集合的上近似的补集来表示全域中那些不能被分类于该子集的元素,上、。由于上、下近似的计算有确定的数学公式,所以边界线区域中的含糊元素个数可以被计算出来,即在真假二值之间的含糊程度可以明确计算出来。作为一种处理含糊和不确定性问题的新型数学工具,粗糙集理论自问世以来,得到了无数学者的坚持不懈地深入研究。最初的关于粗糙集的研究大多是以波兰文发表的,因此当时并未引起国际上数学界和计算机界的重视,研究地域局限于东欧各国。在世纪年代末和年代初由于其在知识发现等领域