在我们阅读文献时,我们经常会看到类似这样的句子:
当数据服从正态分布时,我们要使用这种统计方法进行检验,当数据不服从正态分布时,我们要使用那种方法进行检验。你一定会有疑问,这是为什么呢?判断数据是否服从正态分布在这一过程中到底起到什么作用呢?
其实很多时候,在我们获得数据之后都需要从单一样本中获得样本的信息,并通过统计分析的方法来估计总体的参数信息。在进行统计分析之前,我们需要识别样本的分布特征。
如果你不了解样本的分布特征就会面临选择错误的统计检验的风险。许多统计方法在使用时都会假定数据是服从正态分布的,比如单/双样本-T检验。那么,我们拿到一些数据之前,就要验证一下这些数据是否是服从正态分布的。下面,小编就来给大家简单讲一讲如何使用SPSS对数据进行正态性检验。
先给大家看文献中的一个例子:
从某单位职工2018年体检中获得24名职工的血清总胆固醇( mmol/L)的测量结果如下:
通过计算得到24名职工的血清总胆固醇的均数为=3.88,标准差为S=0.73。通过编制频数表,画出直方图,如下:
从图中可以看出,在均数附近的频数较大(人数较多),并以此为中心左右基本对称,在处理资料时,我们就把它当做数学上的正态分布(图中曲线圆滑)。那么如何用SPSS验证数据是否服从正态分布呢?检验数据是否服从正态分布的方法有很多,这里先给大家介绍几种简单的方法。
1.正态曲线图
点击“分析”,“描述性统计”中的“频率”。
将数据选入变量,点击图表-直方图-在直方图中显示正态曲线。
获得以下结果:
2.峰度和偏度
(见上一篇链接:SPSS数据分析-描述性统计分析)
偏度反映的是分布形状是否对称,偏度>0为右偏,偏度<0为左偏。
峰度反映的是分布形状是平坦还是尖峰,峰度>0为尖峰,峰度<0为平坦峰。
3.KS检验和SW检验
点击“分析”,“描述统计”中的“探索”。
将数据放入因变量列表;点击图,勾选含检验的正态图。
获得以下结果:
由结果看出:KS检验和SW检验的P值分别为0.200和0.999,均大于0.05,因此不能拒绝原假设,认为数据服从正态分布。
4.P-P图和Q-Q图
P-P图是比较理论上正态分布的累积概率与样本数据的累积概率的吻合程度,Q-Q图是比较理论分位数和实际分位数的吻合程度。如果服从正态分布,则数据点应与理论直线基本重合。以Q-Q图为例(P-P图操作类似)。
点击“分析”,“描述统计”中的“Q-Q图”。
数据选入变量框中,检验分布框选择正态,其他默认即可。
由图可看出,图中的点大致都在一条直线上,所以数据满足正态分布。
检验数据是否服从正态分布的方法有很多,这里只是介绍了几种很简单的检验方法。在对数据进行统计分析时,首先要了解清楚数据的分布特征才能选择正确的方法,做到万无一失。#清风计划#
参考链接:
[1] 安胜利.统计学系列讲座 第2讲 正态分布与参考值范围估计[J].护理学报,2006(03):93-94.
[2] 施月仙,赵岳,侯亚红,高敏,王丽君,尚少梅.血液透析患者并发高磷血症的非疾病性因素研究[J].中华护理杂志,2018,53(10):1186-1191.