多元统计实践报告
多元统计分析上机作业 上机课要求:
上机结束后同学们需要完成一份实验报告:报告形式及内容要求包含以下几个方面(时间序列要求一样):
封面,问题叙述,对问题的分析,解决问题所用的原理,所得的结论,对结论的分析,附录(程序等),可以打印,但是绝对不可以拷贝别的同学的,否则会拿不到平时成绩从而影响最终的总评成绩!1、地质勘探中,在 A,B,C 三个地区采集了一些岩石,测量其部分化学成分,数据见下表,(1)检验 A 地区的样本是否服从正态分布 假设各地区的样本均分从()3(,),(1,2,3)iiN i (2)检验0 1 2 3 1 1 2 3:;: , , H H 不全相等(3)检验(1)(2)(1)(2)0 1:;: H H
(4)检验(1)(2)(3)(1)(2)(3)0 1:;: , , H H 不全相等 2、课本 P243 例 6.4.1 要求分别用欧氏距离,马氏距离,闵氏距离定义样品间距离,分别采用最短距离,最长距离,类平均距离,重心距离,ward 距离对16 个城市生活水平进行聚类分析。
3、课本 P215,5-11 4、课本 P288 例 7.3.3,请分别用普通最小二乘回归和主成分最小二乘回归求回归方程,并对比回归方程的军方根误差 OLSE
要求分别用距离法,广义平方距离建立判别准则,对数据进行回判检验判别效果,再对两个未知样品进行判别归类 附:
Z = linkage(Y)Z = linkage(Y, "method")创建逐级聚类树,其中 Y 是由语句 pdist 产生的 n(n-1)/2 阶向量,’method’表示用何方法,默认值是欧氏距离(single)。有’complete’——最长距离法;‘average’——类平均距离;‘centroid’——重心法 ;‘ward‘——递增平方和等。
Y = pdist(X)Y = pdist(X, "metric")计算数据集 X 中两两元素间的距离,‘metric’表示使用特定的方法,有欧氏距离‘euclid’、标准欧氏距离‘SEuclid’、马氏距离‘mahal’、明可夫斯基距离‘Minkowski‘ 等。
H = dendrogram(Z)H = dendrogram(Z, p)
