在写统计分析报告时,会用到描述统计分析和推论统计分析。下面会对以上两种分析方法进行简要介绍。
一、描述统计分析
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
描述统计就好像是使用卫星俯看地球,好像经济学中的宏观经济学,虽不能明察秋毫,却无可替代。常使用的方法有集中趋势分析,如平均数、中数、众数;离中趋势分析,如四分差、平均差、方差、标准差;相关分析,如正相关关系、负相关关系。
二、推论统计分析
推论统计学是指在统计学中,研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
在进行推论统计分析时,需要进行假设检验,计算置信区间和效应量。
1.假设检验
假设检验是统计学中常用的统计推断方法。
假设检验(Hypothesis Testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
(1)假设检验的步骤
进行假设检验的步骤为:
- 提出问题,进行假设
- 论证假设,找到证据
- 给出标准,进行判断
- 得出结论,进行分析
1)提出问题,进行假设
①提出零假设和备选假设
在这一步中,首先要提出一个原假设,也称为零假设,记为
![]()
,同时必须提出备选假设,记为
![]()
。
在提出零假设时,需要注意两个原则,一是零假设遵循受保护对象有利的原则。例如要想证明一款药物是否通过临床检验,一定要从病人的角度考虑,假设药物检验不通过。二是零假设遵循“谁主张,谁举证”的原则。当要论证某一结论成立时,要将零假设设置为结论成立的对立面,就犹如司法制度中的“谁主张,谁举证”。因此,备选假设才是研究者想要结论或结果。
②选择检验类型
假设检验的种类包括:常用的假设检验方法有z检验和t检验。z检验适用于大样本,而t检验则适用于小样本。t检验又可以分为单样本t检验、独立双样本t检验、相关配对t检验、回归输出中的t检验,检验的目的不同,则使用的检验方法也不同。具体使用哪一种,可以根据下图中所示目的进行选择。
图片来源:网络
如何判断什么是相关样本,什么是独立样本呢?若一个样本中的值会影响另一个样本的值,则为相关样本,若两个样本中的值互不影响,那则为独立样本。
③判断抽样分布类型
抽样分布的类型,会影响之后计算的概率值,所以需要对其进行判断。抽样分布类型包括正态分布、t分布和其他分布。当样本数≥30,符合中心极限定理,为正态分布。当样本数<30,且总体近似正态分布时,为T分布,否则就是其他分布。
④判断检验方向
根据假设的形式不同,假设检验可以分为双侧假设检验和单侧假设检验。若零假设是总体参数等于某一数值,如
![]()
,即备择假设
![]()
,那么只要
![]()
和
![]()
二者中有一个成立,就可以否定零假设。这种假设检验称为双侧检验。若零假设是总体参数大于等于或小于等于某一数值,如
![]()
(即
![]()
);或
![]()
(即
![]()
),那么对于前者当
![]()
时,对于后者当
![]()
时 ,可以否定零假设。这种假设检验称为单侧检验。可以分为左侧检验和右侧检验。当备选假设包含小于号,即
![]()
时,为左侧检验,当备选假设包含大于号,即
![]()
时,为右侧检验。
2)论证假设,找到证据
所谓找到证据,其实就是在零假设成立的情况下,计算样本检验统计量的概率p值。
计算p值的步骤为:
1.计算出标准误差
标准误差=样本标准差除以样本大小n的开方。公式如下:
2.计算t值
t=(样本平均值-总体平均值)/标准误差
3.根据t值,查找t表格,计算出概率p值
graphpad官网中,选择通过t值查询计算p值,输入刚才计算出的t值,自动求出p值。
3)给出标准,进行判断
由于假设检验是根据样本提供的信息进行推断的,也就有犯错误的可能。一般会犯两类错误,一类错误是
![]()
为真,结果却拒绝了
![]()
,另一个错误则是
![]()
为假,却接受了
![]()
。我们通常将犯第一类错误的概率称为显著性水平α,犯第二类错误的概率称为β。
显著性水平α必须在每一次统计检验之前确定,通常取α=5%或α=1%。这表明,当作出接受原假设的决定时,其正确的概率为95%或99%。
4)得出结论,进行分析
APA格式是美国心理学会给出的,如何撰写研究论文的完整指南,其中一部分告诉我们如何写出推论统计学结果。可以使用APA格式来报告假设检验的结果。
图片来源:猴子数据分析课程
APA格式提供了3个信息:
①检验类型。确定执行哪一种类型的检验,如上图中,使用t检验,根据自由度,得出t值计算结果,保留两位小数。
②p值。保留两位小数的p值。在p值后面,写上显著性水平α,同样保留两位小数。
③确定检验方向。明确是单尾检验还是双尾检验。
2.置信区间
从总体中选择样本进行计算时,肯定会因为每次选择的样本不同,最终得出的结果也不同,那怎么才能判断得出的结果是否可靠呢?只要有测量和计算,就一定会存在误差,之所以会得出不同的结果,就是因为误差的存在。面对这种情况,我们需要给出一个误差范围,在统计学中也叫置信区间。
我们说某一样本统计的置信水平为95%,指的就是区间内包含总体平均值的概率为95%。
(1)计算大样本置信区间
所谓大样本,是指样本数量≥30。计算大样本置信区间的步骤如下:
1.确定要求解的问题;
2.求样本的平均值和标准误差
3.确定致信水平。常用的置信水平为95%。
4.求出置信区间上下限的值。下限a=总体平均值-z*标准误差,上限b=总体平均值-z*标准误差。
图片来源:猴子数据分析课程
z值可以通过查询标准正态分布表获得,表如下:
因为假设置信水平为95%,所以a+b的概率为5%,即显著性水平α=a=b=2.5%,在表中的倒数第3行,找到α=0.025,进一步查询到下面的z值=1.96。
(2)计算小样本置信区间
计算小样本置信区间的方法和计算大样本置信区间的方法基本相似,不同的是需要根据自由度、显著性水平α来查询t表格,得出t值。t表格如下:
t分布是由自由度df来定义的,自由度指样本中可以自由变动的变量个数,当有约束条件时,自由度减少,df=n-1(样本大小-1)。例如假设置信水平为95%,即单侧显著性水平α=2.5%,若样本总数为10,则自由度df=9,在上表中找到纵坐标自由度为9,横坐标单侧显著性水平α=2.5%的值,t值=2.262。
3.效应量
假设检验是用于判断统计是否有差异,效应量则是判断效果差异大小。在判断某个调查研究的结果,是否有意义或者重要程度时,就需要用到效应量。效应量太小,意味着处理即使达到了显著水平,也缺乏实用价值。
常用的效应量指标有Cohen's d指标和r平方指标。
Cohen's d表示的是标准化均值差异,求出的值越大,说明效果越显著,效果差异越大。公式为:
r平方表示的是两个变量之间的关系程度,r平方范围从0到1,r平方值=0表示两个变量之间根本没有联系,r平方值=1表示完全相关,既r平方越大,说明效果差异越大。公式为:
t为通过t检验求出的t值,df为自由度。
效应量报告格式:d=x.xx ,R2=.xx