文档名称：

多元统计分析课程报告.doc

格式：doc 大小：485KB 页数：34页

下载后只包含 1 个 DOC 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

多元统计分析课程报告.doc

上传人:iris028 2019/11/20 文件大小：485 KB

下载得到文件列表

多元统计分析课程报告.doc

相关文档

文档介绍

文档介绍：利用系统聚类分析为沉降史模拟结果分析选取合适地震测点-----以礼乐盆地05cpvc360测线为例摘要:在对含油气盆地进行地震勘探时,得到的地震测线数据极为庞大。我们在研究南海礼乐盆地构造演化过程时,已经选取了十条测线进行沉降史模拟,而每条测线中均包含了数十个测点。然而,当我们根据模拟结果定量和动态描述盆地的拉伸沉降过程、对礼乐盆地的构造沉降和总沉降变化趋势进行了定量分析时,需要从这些数量众多的测点中选择其中极少的几个进行具体分析。因此,本文以礼乐盆地05cpvc360测线所包含的29个测点为例,借助最短距离、最长距离和重心法三种系统聚类方法,选取其中具有代表性的部分测点,同时保证得到的沉降史信息仍然足够大。一、聚类分析概述(一)聚类分析的原理及基本思想聚类分析(clusteranalysis)就是根据空间点群的“亲疏”关系进行分类的一种方法。为此要给出表示空间点与点之间“亲疏”关系的相似性度量,然后讨论根据相似性度量进行点群簇分的方法和应用。聚类分析目的是把分类对象按一定规则分成若干类,这些类不是事先给定的,而使根据数据的特征确定的。在同一类中这些对象在某种意义上趋向于彼此相似,而在不同类中对象趋向于不相似。聚类分析根据对象不同可分为Q型聚类分析(对样本进行聚类)和R型聚类分析(对变量进行聚类)。本文的目的在于减少样品数量(数据点),所以采用Q型聚类。在进行聚类分析时,可以用“距离”来度量各数据点的接近程度。两个数据点之间距离越小,表示两者之间共同点越多;距离越大,共同点越少。最终,本文确定采用系统聚类来解决问题。(二)数据点层位界面的选择一条测线上的数据点对应着盆地不同地质时期的界面深度。本文选取的测线05cpvc360在沉降史模拟过程中保留下29个数据点(样本),每个数据点对应八个层序界面的深度(变量)。我们借助这些各不同界面的深度值作为度量数据点之间相似程度的依据。二、实证分析(一)样本选择,数据来源及预处理选取礼乐盆地05cpvc360地震测线(数据来自中海石油(中国)有限公司湛江分公司《礼乐盆地层序地层学分析及有利储层展布研究》项目)作为实例,选取的层序界面如下:x1:T100x2:T90x3:T81x4:T80x5:T70x6:T60x7:T50x8:T0用Xij表示第i个数据点在层序界面j的数据,即可得X=(xij)的原始数据矩阵,见表1表1层序界面深度表(单位:km)