1 / 51
文档名称:

多指标面板数据的聚类分析研究.docx

格式:docx   大小:282KB   页数:51页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多指标面板数据的聚类分析研究.docx

上传人:daoqqzhuanyongyou2 2020/12/14 文件大小:282 KB

下载得到文件列表

多指标面板数据的聚类分析研究.docx

相关文档

文档介绍

文档介绍:管理信息系统课程小组作业
多指标面板数据的聚类分析研究
以我国15个副省级城市综合竞争力评价为例
小组组长:
小组成员:
XXXXX
XXXXX
XXXXX
完成时间:
指导教师:徐德华
目录
1选题背景与意义 4
2聚类分析与聚类算法 5
5
相关概念与定义 5
5
7
传统聚类算法及其比较 7
14
3面板数据及其聚类方法 15
15
概念及发展 15
面板数据的特点 16
16
17
18
18
18
4实证研究 23
23
城市竞争力内涵研究综述 24
26
30
31
421城市竞争力评价指标选取的原则 31
422我国15个副省级城市竞争力评价指标体系 31
32
基于主成分分析的聚类 32
39
基于概率连接函数的聚类 41
43
5结论与展望 44
结论 44
44
主要参考文献 45
附录 46
附录 1 -46 ••
附录 2 -46 ••
附录 3 -48 ••
1选题背景与意义
面板数据(Panel Data )作为截面数据与时间序列数据的组合数据集,同时 体现了空间维度和时间维度的数字特征,克服了时间序列数据多重共线性、数 据量不足等困扰,逐渐发展成为现代计量经济学领域统计分析与统计研究的重 要方法和工具。运用多元统计方法对面板数据进行聚类分析是统计学的新兴研 究领域。
聚类分析作为一种数据挖掘手段,已被广泛地应用在许多领域中,包括模 式识别、数据分析、图像处理、市场研究、管理评价等。传统的聚类分析对象 一般是固定时期的不同个体截面数据,二维数据聚类分析往往不能满足人们分 析问题的需要,而且基于单一的固定时期的聚类分析往往抹杀了指标的动态发 展趋势及其发展状态,无法预测其未来发展轨迹和所属类别。例如:在城市竞 争力聚类分析中,竞争力存在着随时间动态变化过程,仅仅固定在某一年度的 截面数据分析就显得有失偏颇,如果根据一个较长时期的面板数据进行聚类分 析则显得较为合理。
城市竞争力 是国内近年来正在兴起的一个新课题,目前处于起步研究阶 段,还未形成公认的完整体系。经济全球化,知识经济时代的到来,促使我国 城市必须进行转型改革,走上新型的发展道路。我国现阶段的城市要从建设城 市转向管理和经营城市,就是要重塑城市资源整合和配置资源机制,提高城市 对社会资源的吸引力和创造社会财富的能力,从根本上就是提高城市竞争力。 城市竞争力评价是典型的综合评价,在不同的评价体系下有不同的指标指标, 而且必须考虑时间因素,因此相关的数据就是典型的多指标面板数据。
1994年5月,经中央机构编制委员会第6次会议通过,决定将原来的14个计 划单列市和杭州、济南 2市正式确定为副省级市(其中,重庆市 97年恢复直
辖)。将这15个城市定为副省级市,是中央对于区域经济发展的重要决策,加 强了省级机构统筹规划和协调的地位和作用,不仅有利于加快这些城市的经济 与社会发展,而且有利于更好的发挥这些中心城市的辐射作用。在国家政策层 面和经济决策权待遇同等的情况下,经过 20年,这15个副省级城市的发展出现 了很大差异,城市竞争力也日趋呈现差异化。鉴于此,我们小组决定利用多指 标面板数据的聚类方法对此进行探析,一方面介绍面板数据的一些处理思路, 另一方面通过聚类寻找15个城市类别之间的差异,以提出相关建议。
2聚类分析与聚类算法


聚类分析(Cluster Analysis )又称群分析,是根据“物以类聚”的道
理,对样品或指标进行分类的一种方法,其目的是将有限个无标注数据划分到 有限个离散的组或类中,发现数据隐藏的内部结构。聚类分析是数据挖掘的一 种重要手段,是一种无监督的模式分类方法,在分类时只依赖对象自身所具有 的属性来区分对象之间的相似程度。聚类分析作为一种有效的数据分析方法被 广泛应用于数据挖掘、机器学****图像分割、语音识别、生物信息处理等方 面。
给定一个对象集合X Xi,X2」||,Xn