文档介绍:距离判别摘要: 针对 2005 年全国各地区以及国有控股工业企业的经营状况的经济指标的问题用谱系聚类中的最长距离法将 29 个省市分为三类,再根据距离判别法理论与方法建立模型最终确认待定地区广东与西藏属于哪个地区。关键词谱系聚类:距离判别法;马氏距离一、问题提出与分析 1 问题提出: 为了研究 2005 年全国各地区以及国有控股工业企业的经营状况的经济指标, 如表一样品序号地区 X1 X2 X3 X4 X5 X6 X7 1北京 2上海 28 3天津 4河北 5山西 6 内蒙古 7辽宁 8吉林 9江苏 10浙江 11安徽 12福建 13江西 4 14山东 15河南 16湖北 17湖南 18广西 19海南 20重庆 21四川 22贵州 23陕西 24甘肃 25青海 17 26宁夏 9 27 黑龙江 28云南 29新疆 表二:待判的地区样品序号地区 X1 X2 X3 X4 X5 X6 X7 1广东 13 2西藏 其中 x1- 工业增加率(%), x2- 总资产贡献率(%), x3- 资产负债率(%), x4- 流动资产资转的次数(次), x5- 工业成本费用利用率( %), x6- 全员劳动成产率( %), x7- 产品的销售率(%), 问:利用距离判别建立判别函数判定广东、西藏分别属于哪个发展的类型 2 、问题分析距离判别法的基本思想: 样本和哪个总体距离最近, 就判别它属于哪个总体。距离判别也称为直观判别法。 马氏距离定义设总体 G为m 维总体(考察 m 个指标) ,均值像量为?? 1 2 = Tm ? ????,, 协差阵为????= ij m n ???,则样品?? 1 2 = , , Tm X x x x ?与总体 G 的马氏距离定义为?????? 2 1 , T d X G X X ? ??? ? ???当 m=1 时,?????