文档介绍:摘要
摘要
基于网格的信息分发系统中,需要处理海量信息,不仅信息量大属性缺失的
数据也常见。若不能进行正确处理,就会产生信息淹没与数据垃圾,无法获取信
息优势。本文研究的基于粗糙集的分类模型正是针对这个问题而提出。分类模型
是信息分发系统中的一个重要组成部分,其主要目标是保证将有效信息分类并分
发给真正需要它的用户。
分类模型的关键部分是用户需求发现,它通过对用户历史访问信息的行为进
行学习,找出不同用户对不同类型信息的潜在兴趣。实质上,用户需求发现可归
属于分类知识发现的范畴。分类知识发现将通过对反映用户历史访问行为的用户
信息需求进行分类预测分析,把用户信息需求分为有无需求两大类。分类知识发
现模型可由不同的分类知识发现技术来构建。但是,有的分类知识发现技术建立
的模型要么比较复杂,要么需要一定的先验知识——这种方式具有主观性。;糙
集作为一种有效的数据分析工具,与其它知识挖掘技术相比,在解决分类问题上
有独到的优势,在较少的数据中也可挖掘出较好的规则或知识,生成的规则易于
理解,而且该方法简单、易于操作。
鉴于上述分析,本文对基于粗糙集的分类知识发现进行了研究。重点研究了
基于粗糙集的分类知识发现模型中的重要部分——属性约简、分类规则约简、分
类预测以及在属性缺失条件下的分类算法。属性约简方面,结合属性约简的基本
概念,提出了求绝对核的算法,改进了属性约简算法,此算法提高了计算效率。
在规则约简方面,重新定义了核值,使之适用于不一致决策表,以此为基础,提
出了既适合一致决策表又适合不一致决策表的分类规则约简算法。在分类预测方
面,将基于相似度的分类预测方法应用于无规则匹配的情况。在属性缺失的条件
下,对每个条件属性的重要度进行了定义,给出了不影响整个系统时间复杂度的
缺值分类算法。
本文还对上述所提算法在信息分发系统中的应用进行了研究。一方面,在信
息分发系统总体结构的基础上,对信息分类功能进行了分析和设计。另一方面,
研究了基于粗糙集的分类模型在信息分发中的应用,实现了用户需求发现。
关键词:用户需求发现,分类知识发现,粗糙集,属性约简
第一章绪论
第一章绪论
论文选题的目的和意义
信息分发管理,是根据各用户
人员对信息的需求、各区域内可用资源、基础设施可用性、安全政策确定的信
息流的基础上,以不同用户人员所希望的不同的模式分别向他们提供信息的认
知、访问、递交等一系列的相关过程。简而言之,信息分发管理就是使信息在
目标时间内,以正确的方式分类递交到真正需要它的用户手上,既实现由信息
优势向决策优势的转化。
因特网的广泛使用使得各企业面对的已不再是本单位甚至本行业的各类信
息,传统的统计学分析方法由于是建立在一定的假设之上的,这限制了它的应
用范围,特别是信息分发管理应用于大型企业后,庞大的数据量很难再采用统
计学作为分析、分类的手段。而数据挖掘采用基于发现的方法对数据进行知识
发现或采掘,能够发现隐含在数据中人们不知道的知识,从而科学地辅助人的
决策。目前,信息分发方面存在如下的问题。
畔⒁旃剐裕贾鹿蚕碛牖ゲ僮骼
由于用户间信息的格式不同、需求方式不同,特别是不能进行互操作,所
以信息生成者不能以用户所希望的格式向其提供易于使用的信息,同时也限制
了用户人员对关键信息的获取能力。在多变的实际环境下,决策人员不能根据
实际情况的变化动态调整其信息需求,以确保关键信息特别是重要信息的接收。
畔⒓写恚圃剂讼低承畔⒋淼男
由于受到系统各级策略单元互操作能力的限制,以及出于信息安全方面的
考虑,大量的信息在顶层集中处理,这种情况在系统部分失效时,大大制约了
系统的信息支持能力:其次,对信息处理优先等级的划分大多按照上下级关系
或固定模式确定,不能根据任务进程的发展动态调整信息处理模式,降低了信
息优势向决策优势转换的过程。
畔⒋砟J焦潭ǎ薹ò葱杼峁┲С
大量的信息处理基本上按照系统初始设计模式固化和运行,无法根据实际
情况的变化,按需动态地调整信息处理方法,影响了信息处理的效率和质量。
对信息的处理,缺乏更加有效的存储、检索、表述、量化的标准和能力,延误
电子科技火学硕宦畚
了用户人员高效使用信息、执行行动的时间,在多系统协同完成任务时这种不
足表现得更为突出。
畔⒎址⒎绞胶投鞫热狈α榛钚
目前受信息传输带宽的限制,大多系统都采用专用的信息传输协议,采用
的信息分发网络大多以树状结构为主,逐级传输,降低了系统对武器的无缝连
接能力,降低了信息的安全传输能力和效率,更无法保障不同系统间信息的交
互。另外,对信息分发的优先级处理能力不足,没有动态调