16.某地区35个城市2004年的7项经济统计指标数据见下表。
(一)试用最短距离聚类法对35个城市综合实力进行系统聚类分析,并画出聚类谱系图。
(1)步骤:
①分析——分类——系统聚类
②将城市编号的类型改为字符串,不然个案那里导不进去。
③将城市编号导入个案,其他变量导入变量。
④统计选项选合并进程表和无。
⑤绘图勾选谱系图、所有聚类和垂直。
⑥最短距离法改标准化那,选范围-1至1。
(2)结果
①个案处理摘要
②凝聚计划(部分截图)
③个案
④谱系图
(2)分析结果
聚类距离不同,聚类结果就不同。当距离为0时,每个样本为单独的一类,一共有35类;距离为5,就有11类;距离为10,就有7类,以此类推,当距离为25时,只有1类。
(二)试用主成分分析法对35个城市7项经济指标进行主成分分析,并分析其综合实力。
(1)操作步骤
①分析-降维-因子分析,导入变量。
②描述里Statistics全选,相关性矩阵中勾选系数、显著性水平、反映象、KMO和巴特利特检验。
③抽取中方法选主成分,分析勾选相关性矩阵,输出全部勾选,抽取选基于特征值。
④方法选最大方差法,输出全部勾选。
⑤得分选回归,勾选显示因子得分系数矩阵。
(2)分析数据
①相关系数矩阵
分析:
表格的上半部分是相关系数,相关系数为负数就表示两个变量是负相关,正数则表示两变量成正相关。
表格的下半部分是显著性水平(即P值),和0.05作比较,小于0.05则说明两个变量是显著性相关。
②KMO和巴特利特检验
分析:
KMO检验可以检验变量之间的偏相关性,范围在0~1之间,越接近1说明偏相关性越好,因子分析效果越好。
>0.6,有效性可以接受。
>0.8,有效性非常好。
③反映像矩阵
分析:
只看相关性矩阵部分的对角线,如0.623a是KMO系数,>0.6 则说明有效性有所欠缺。
④总方差解释
分析:
从>1的特征值来筛选,一共有2个。这两个主成分总共解释了总方差的88%以上。
⑤碎石图
分析:
和上面的总方差解释结合来看,重点看拐点,从图可知2是一个拐点,从而得知我们选择公因子为2没有问题。
⑥成分矩阵
分析:
主成分分析法提取了2个主成分出来,此表展现了它们的分布情况,包含了提取后各个主成分和变量之间的所有相关系数,如0.827>0.374,表明总人口属于第二主成分。
⑦载荷图
分析:
是一个二维图,辅助成分矩阵来看,靠的近的变量可能属于同一主成分。
⑧成分得分系数矩阵
分析:
可以看出旋转后的得分情况,如果因子载荷≥0.3则是显著相关的关系,再根据这个标准给每个因子归类。
总结论:
第一个主成分包括工业总产值、地方财政预测内收入、城乡居民储蓄余额、在岗职工总额,第二个主成分包括非农业人口比例、农业总产值,达到了降维目的。
(三)以第一、二、三主成分为变量,进行聚类分析,结果又怎样呢?
(1)操作步骤
①因为只有2个变量,不符合题目要求。
②所以要再提取因子,其他步骤和主成分分析一样,就不放截图了。
③再采用聚类分析。
④将3个主成分导入变量。
⑤统计中勾选合并进程表、近似值矩阵,聚类成员选无。
⑥绘图中勾选谱系图,分类选所有聚类,方向选垂直。
⑦重点是标准化处理,选Z分数。
(2)结果
①个案处理摘要
②非相似性矩阵太大了,不好截图,总之它是将每个样本当成一个个案,计算相似度。
③凝聚计划(看每一组是如何合并到一起的)
④个案
分析:取个数为10,则可分为12类。
⑤谱系图(和个案结合着)
学无止境!提示您:看后求收藏(同创文学网www.tcwxx.com),接着再看更方便。