1 / 10
文档名称:

聚类-主成分分析.docx

格式:docx   大小:293KB   页数:10页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类-主成分分析.docx

上传人:w447750 2018/1/17 文件大小:293 KB

下载得到文件列表

聚类-主成分分析.docx

相关文档

文档介绍

文档介绍:主成分-聚类分析法在管道风险评价中的应用
摘要:管道在运行过程中面临着多种风险,对管道所面临的风险进行一定的统计分析可以更精确地分析得出不同风险段的不同风险因子对评价结果的影响程度。本文按照管段实际情况选择有差异的10个风险指标X1(埋深),X2(壁厚),X3(人口密度),X4(公众态度),X5(上方活动),X6(阴保电流),X7(土壤腐蚀),X8(杂散电流),X9(敷设方式),X10(土体类型)建立风险评价流程,通过标准化,主成分分析和聚类分析,降低了管道风险指标间的相关性和赋权主观性,提取了管道风险指标的3个主成分因子,然后结合指标间的相关性,最终得出了管段的风险分类和排序。这可以提高提高管道风险评价体系的可靠性和实用性,具有实际的意义。
关键词:油气管道、风险评价、主成分分析、聚类分析
1 问题背景
管道风险评价作为管道风险管理的基础,其目的是通过计算某段或整条管道系统的风险值对各个管段或整条管道进行风险排序,以识别高风险部位,确定那些最大可能导致管道事故和有利于事故预防的至关重要的因素,确定管段的优先次序,为维护活动经济性的决策提供依据,最终使管道的运行管理更加科学化。
主成分分析法从数据的内部结构出发,通过数学变化产生综合评价指标涉及的赋权,减弱了多指标综合评价体系中的主观性影响。聚类分析是依据数据相似度,将大量数据点的集合分成若干类,使得每个类中的数据间最大程度地相似,而不同类中的数据最大程度地不同。采用主成分-聚类分析法开展管道风险评价,在消除管道风险评价指标信息重叠和主观性的同时,实现依据风险指标对管道管段的排序、归类,为管道风险管理,维抢修物资、人员的配置提供科学依据。
2 方法模型
主成分分析
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始
变量的信息,,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。Fp = a1i*ZX1 + a2i*ZX2 + ……+ api*ZXp,其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化。
A=(aij)p×m =(a1,a2,…am,),
Rai=λiai,
R为相关系数矩阵,λi、a