专业综合调研报告
专 业 综 合 调 研 报 告 班级:金融 172 班 学号:1620174122(21)姓名:陈雨楠 成绩:
一、研究设计 本报告调取中国国家统计局及国泰安 CSMAR 数据库中我国自 1990 年以来至 2018年各年度失业率与国民生产总值,探究当年国民生产总值同比增长是否与当年失业率有关系。其中,失业率 2 2--3% 为低失业率组,3 3--4% 为中失业率组,大于 4% 为高失业率组。
国民生产总值为国民生产总值指数(上一年为 100)二、研究设计 使用单因素方差分析时,需要考虑 6 6 个假设。
假设 1 1 :因变量为连续变量; 假设 2 2 :有一个包含 2 2 个及以上分类、且组别间相互独立的自变量; 假设 3 3 :每组间和组内的观测值相互独立; 假设 4 4 :每组内没有明显异常值; 假设 5 5 :每组内因变量符合正态分布; 假设 6 6 :进行方差齐性检验,观察每组的方差是否相等。
三、研究过程
1.异常值检验 首先利用箱线图,检查各组别是否存在异常值,经检验高失业率有异常值,此种异常值是真实的数据,因此在本次研究中代入其中进行研究 2.正态检验 正态性检验 失业率水平Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig.统计量 df Sig.国民生产总值 低.245 6.200*.873 6.239 高.156 15.200*.942 15.408 中.133 8.200*.971 8.904 *.这是真实显著水平的下限。
a.Lilliefors 显著水平修正 如果数据符合正态分布,显著性水平(蓝框中的Sig.)应该大于0.05。Shapiro-Wilk
检验的无效假设是数据服从正态分布,备择假设是数据不服从正态分布。因此,如果拒绝无效假设(P<0.05),表示数据不服从正态分布;如果不能拒绝无效假设,则不能认为数据不服从正态分布。本例中每组正态性检验P值均大于0.05,因此不能认为每组因变量不服从正态分布。
3.ANOVA分析 描述 国民生产总值 N 均值 标准差 标准误 均值的 95% 置信区间 极小值 极大值 下限 上限 低 6 110.5833 3.82487 1.56150 106.5694 114.5973 104.10 114.10 高 15 109.6333 2.28181.58916 108.3697 110.8970 106.40 114.70 中 8 108.1250 1.28702.45503 107.0490 109.2010 106.30 110.10 总数 29 109.4138 2.53444.47063 108.4497 110.3778 104.10 114.70 方差齐性检验 国民生产总值 Levene 统计量 df1 df2 显著性 3.643 2 26.040 如果 Levene"s 检验的差异具有统计学意义(P P <0.05),则不满足方差齐的假设; 如果 Levene"s 检验的差异无统计学意义(P P >0.05),则不能拒绝方差齐的假设。
本例中,P P =0.04,表示各组方差 不 相等。
单因素方差分析 国民生产总值 平方和 df 均方 F 显著性 组间 22.218 2 11.109 1.832.180 组内 157.637 26 6.063 总数 179.854 28 单因素方差分析
如果单因素方差分析显示差异具有统计学意义(P<0.05),表示不是所有组的总体均数均相等(至少有一组均数不同于另一组)。
如果P>0.05,则表示各组间均数差异无统计学意义。
本例中,P值显示为0.18,表示不具有统计学意义 多重比较 因变量: 国民生产总值(I)失业率(J)失业率 均值差(I-J)标准误 显著性 95% 置信区间 下限 上限 Tukey HSD 低 高.95000 1.18941.707-2.0055 3.9055 中 2.45833 1.32980.174-.8461 5.7627 高 低-.95000 1.18941.707-3.9055 2.0055 中 1.50833 1.07799.356-1.1704 4.1870 中 低-2.45833 1.32980.174-5.7627.8461 高-1.50833 1.07799.356-4.1870 1.1704 Games-Howell 低 高.95000 1.66895.841-4.0630 5.9630 中 2.45833 1.62645.352-2.5680 7.4847 高 低-.95000 1.66895.841-5.9630 4.0630 中 1.50833.74442.131-.3691 3.3857 中 低-2.45833 1.62645.352-7.4847 2.5680 高-1.50833.74442.131-3.3857.3691 可以看出,在多重比较下,高失业率下国民生产总值较中失业率多1.5,较低失业率少0.95,不具备统计学意义
均值相等性的键壮性检验 国民生产总值 统计量 a df1 df2 显著性 Welch 2.600 2 11.420.117 a.渐近F 分布。
当方差不齐时,必须使用校正的单因素方差分析。本例采用Welch 方差分析,F(211.420)=2.600,P<0.117 四、结论
各组间均数差异无统计学意义(P >0.05)。因此,不能拒绝无效假设,不能接受备择假设。作出条形图如下,另附报告所使用数据
