文档介绍:第卷第期计算机技术与发展. .
年月.
基于属性约简与参数优化的故障诊断研究
李莎,陶红,高尚
江苏科技大学计算机科学与工程学院,江苏镇江
摘要:应用数据挖掘的方法从实时数据库中提取相应的故障诊断知识是一种有效途径,也是很有现实意义和研究价值
的问题。为提高汽轮机组故障诊断的效率,并考虑其计算成本和复杂性,把关联分析作为数据的前处理器,通过计算属性
问的相关系数,结合最大最小聚类方法,删除冗余属性。然后采用支持向量机进行故障诊断,构造多分类器,采用粒
子群优化算法对参数寻优并训练样本。并与神经网络和线性判别分析做比较,实验表明此故障诊断方法诊断速度快、
准确率高,可以很好地应用于设备故障诊断。
关键词:支持向量机;关联分析;最大最小距离;粒子群;故障诊断
中图分类号: 文献标识码: 文章编号:—
,,
,
,,
:—
. .’
,—.
,,.
,缸.
.
: ; ;—;;
引言值、维数灾难等问题。用于故障诊断的最大优势
对于电力企业而言,越来越多的数据被和在于它适用于小样本决策,能进行实时在线监控。随
系统存储到实时数据库中,日积月累的历史数据着应用的广泛,支持向量机的不足也逐渐被关注,在模
占据着庞大的存储空间,这些数据背后往往蕴涵着丰型参数选择方面,目前还缺乏有效的方法和理论依据,
富的知识,仅靠经验很难理解这些数据之间的关系,应对其分类精度有着很大影响。其次,在对大量数据进
用数据挖掘的方法从系统的历史数据库中提取相应的行模式分类和时间序列预测时,如何缩短样本的训练
故障诊断知识应该是一种有效途径,也是很有现实意时间,仍是需考虑的问题。文中提出关联分析结合最
义和研究价值的问题。支持向量机大最小聚类方法对样本属性约简,然后采用粒子群优
,是数据挖掘的新方法,是一种小样化算法对参数寻优,并用于汽轮机组故障诊断,
本多元数据分析方法,具有很强的容错能力和泛化能实验表明前述方法诊断速度快,准确率高。
力,克服了传统机器学习中过学习、欠学习、局部极小
属性约简
收稿日期:——;修回日期:
一些软计算方法,如神经网络、遗传算法、决策树、
基金项目:人工智能四川重点实验室开放课题
作者简介:李莎一,女,江苏泰州人,硕士研究生,研究方向粗糙集和关联分析被频繁用于删除不相关的、冗余
为数据挖掘、模式识别与智能系统;高尚,副教授,硕士生导师,主属性。当应用于工业中,需要考虑其计算成本和复杂
要从事系统理论及智能计算方面的研究。性,故采用关联分析方法引。相关分析法是在分析某
· · 计算机技术与发展第卷
个问题或指标时,将与该问题或指标相关的其他问题不能令人满意。遗传算法“的编程实现比较复杂,
或指标进行对比,分析其相互关系或相关程度的一种首先需要对问题进行编码,找到最优解之后还需要对
分析方法,用少数几对综合变量来反映组变量间的问题进行解码,另外三个算子的实现也有许多参数,如
线性相关性质。给定两个属性,这种分析可以根据可交叉率和变异率,并且这些参数的选择严重影响解的
用的数据度量一个属性能在多大程度上蕴涵另一个。品质,而目前这些参数的选择大部分是依靠经验。其