文档介绍:山东大学
博士学位论文
姓名:裴海峰
申请学位级别:博士
专业:系统理论
指导教师:史开泉
20070418
个崭新领域一数据挖掘和数据库知识发现粗集推广与应用研究摘要当今,随着电子存储设备的发展,使得各个领域的数据和信息急剧增加力提出了一个很大的挑战。为了有效地维护和利用这些丰富的信息资源,人类在与疃喾椒ㄖ校饧砺塾敕椒ú皇R恢纸衔S行У姆椒ā在过去的十年中,粗集理论已经引起了众多研究人员的关注,并且被广泛的应用到各个领域。给定一个具有离散属性值的数据集合,利用粗集的方法就能够属性值的数据集合。然而,这种方法通常是不合适的,因为方法在实现过程中此,就需要改进这些方法,寻找一种适用于实值数据集合数据约简的的方法。蕉ù笱в胂低晨蒲аг海媚希息爆炸宜孀攀奔涞耐埔普庑┦莺托畔⒔灾甘兜乃俣仍黾印R蚨何从这些数据中挖掘潜在的、有利用价值的信息就给人类的智能信息处理的能就需要研究一些能够自动处理这些问题的方法。由此产生了人工智能研究的一找到初始属性集合的一个子集,并且这个子集保留了原始数据集合最多的信息,因此将属性集合中的其它属性删除后,数据集合所包含的信息不会丢失,从而实现对数据集合的数据约简。然而,在实际应用中,数据集合的属性值通常是实数值。此时,租集理论就不能够判断两个属性值是否相似还是在某种程度上是相同的。这就是传统的粗集理论需要面对的问题。解决这个问题的一种方法可以事先将数据集合离散化,生成一个具有离散忽略了属性值对于离散属性的隶属度,从而导致了数据集合信息的丢失。鉴于事实上模糊租集理论就是其中~种方法。:旨砺劢芍识中的不确定性产生的模糊性与粗糙性这两个相关却又不同的两个概念有机地结合在了一起。另外一种方法就是利用函数粗集理论。函数粗集理论将数据集合里的对象及其属性值看作是对象关于属性的函数,从而将对象的整体特征作为函数规律裴海峰山东大学博士学位论文
最后讨论了模糊租集:与模糊粗集上、下近似的唤丶经对象信息在传递过程中的可靠性问题。当同一个模糊对象在多来挖掘。本文正是基于上述两种粗集的推广理论,给出了研究与讨论。本文共分六章。主要研究内容与创新成果如下:芯磕谌攵阅:旨岢隽耸粜缘乃炒吻ㄒ坪澹母拍睿⒃诖嘶础上给出了等价类的追纸饫嗉,阶还原类等定义;当属性集合存在迁移函数时,等价类就会发生变化,相应的对于待识别模糊对象的模糊粗集也就随之发生变化,对于其变化形式做了研究;同时讨论了迁移函数作用前后,待识别模糊对象所对应的模糊粗集的结构变化特征;典集合涞墓叵怠芯吭诙郺信息传递的系统中,当传递的对象是一个模糊概念,该如何定义对象在传递过程中的形式;被传递的对象信息在传递过程中是不断交化的,如何衡量对象信息的变化量;同时讨论了如何衡量传递时,可能会有两种情况出现:一种是每一个挥幸桓龇直嬷识:另一种是某些赡芎胁恢挂桓龅姆直嬷J丁T诘谝恢智榭觯我们该如何安排各个慕邮账承虿拍苁沟枚韵笮畔⒃诖ǖ莨中的可靠度最大。同样在第二种情况下,所有可能的信息流路构成了一个信息流网络,我们又该如何选择一条可靠度最大的信息流路。针对这两种情况,本文在相关章节中分别建立了寻找最优传递路线的数学模型,同时讨论了所建模型的求解方法。芯苛撕燃劾嗷谇涫粜缘姆纸庑问揭约昂旨谇间属性的分解形式,讨论在连续意义下甈旨牒旨的关系。旨砺壑校跏己燃劾嗳绾胃鲆约昂旨ㄒ逯械严格的包含关系及交运算限制了其在实际问题中的应用。为了解决这个问题,研究了函数论域上的模糊相似关系,在此基础上给出了占一函数粗集的概念及其性质定理,同时讨论了投资系统中如何确定投资组合的问题。提出了时序信息系统的概念,利用占一函数粗集理论给出了山东大学博士学位论文
集之间的关系,创新点攵阅:旨岢隽耸粜缘乃炒吻ㄒ坪,,,母拍睿集的,一分解与,一还原定理:给出了模糊粗集与模糊粗集上、下近似的兄一截创新点獳提出的粗交流的概念做了推广,提出了模糊粗交流的概念。定义了模糊对象在从到的模糊粗交流传递过程中的平均损失信息量埃珹胱芴蹇煽慷取啊。并且在只有一个传递对象,多扛鯽只有一个分辨知识或某些赡懿恢挂桓龇直嬷J读种情形下,建立了寻找最优传递线路的数学模型,并给出了模型的求解算法,创新点隽撕塾蛏虾:嗨贫鹊母拍睿⒃诖嘶∩辖际问题上具有更强的适用性。讨论了规律集合的相对可识别性,同时给出了规问题的数学模型并给出了相应的模型求解过程。首次提出了时序信息系统的概时序信息系统上的属性约简及规则提取的方法。最后建立了连续信息系统上的不可分辨关系,给出连续信息系统属性约简的思路。:玻海口哦隽四:饧模徊⒎纸舛ɡ怼创新点杏诘章中。同时给出的算例证明了算法的有效性。创新点谇涫粜