文档介绍:健康城市的客观环境综合评价方法及其应用
胡巧玲 【摘 要】 文章重点结合重庆实际,在调查研究的基础上,介绍了健康重庆综合评价方法,并就改进的方法进行了分析。
【关键词】 健康城市 健康重庆 综合评价指标
Abstra望用较少的新指标代替原来较多的旧变量,同时要求这些新指标尽可能地反映原变量的信息。主成分分析正是解决此问题最有效的多元统计方法,此方法能够提取信息,使变量简化降维,从而使问题更加简单直观,在经济、社会等领域得到广泛应用。
主成分分析是考察多个变量间相关性的一种多元统计方法。它是研究如何通过少数几个主分量来解释多个变量间的内部结构。也就是说,从原始变量中导出少数几个主分量,使他们尽可能地多保留原始变量的信息,且彼此间互不相关。主成分分析常被用来寻找判断某种事物或现象的综合指标,并且给综合指标所包含的信息以适当的解释,从而更加深刻的揭示事物的内在规律。
通常数学上的处理是将原来的p个指标作线性组合,作为新的综合指标。如果将选取的第一个线性组合即第一个综合指标记为F1,我们自然希望F1中尽可能多的反映原来指标的信息,这里的“信息”用什么表示呢?最经典的方法就是用F1的方差来表达,即Var(F1)越大,则表示F1包含的信息越多。因此在所有的线性组合中所选取的第一主成分应该是方差最大的。如果第一主成分不足以代表原来p个指标的信息,再考虑选第二个线性组合F2,即第二主成分,依次类推可以造出第三,第四,……,第p个主成分。这些主成分间互不相关,且方差递减。在实际应用中,通常只选前面几个最大的主成分,虽然这样损失了部分信息,但使我们抓住了主要矛盾,并从原始变量中进一步提取了某些信息,从而既减少了变量的数目又抓住了主要矛盾,有利于问题的分析和处理。
假设有n个样本,测得p项指标(p<n)。得到原始数据资料阵:
X=(X1,X2,Λ,Xp),且协差阵为Σ,令协差阵的特征值为λ1≥λ2≥…≥λp,所以有Var(F1)≥Var(F2)≥…≥Var(Fp)≥0,向量l1,l2,…,lp为相应的单位特征向量,则X的第i个主成分为:
Zi=l'iX(i=1,2,Λ,p)
在实际问题中,往往协差阵Σ未知,这时可以用其估计值S(样本协差阵)来代替。同时由于指标的量纲不同,所以在计算前往往要消除量纲的影响,而将原始数据标准化,此时
S=R=1/nX'X
因此也可以计算相关阵,从而得到特征值并进行主成分分析。一般我们不会取p个主成分,而是累计贡献率的大小取前k个。
表示前面k个主成分提取了多少的信息。一般来说,如果前k个主成分的贡献率达到85%,表明前k个主成分基本包含了全部测量指标所具有的信息,这样既减少了变量的个数又便于对实际问题的分析和研究。
:
在SPSS中定义变量X1-X27,进行主成分分析。SPSS调用Factor Analyze过程进行分析时,首先就是对原始变量进行标准化,因此以后的输出结果中在通常情况下都是指标准化后的变量。(X1:孕产妇死亡率(1/10万),X2: 新生儿死亡率(‰),X3: 急性传染病发病率(