相关性分析介绍
生物和医学统计中,相关分析属于流程前端的探索性分析,研究变量间关系及性质,其结果在为下一步采取何种方法做出指引,为数据挖掘之前的基础工作。
相关系数的选择
相关分析之前,需要先确认变量的类型,根据具体类型选择合适的相关系数。Pearson相关系数适用于两变量的度量水平都是连续数值型,且两变量的总体是正态分布或者近似正态分布的情况,还有说法认为其样本量应大于30,可供参考,如果不满足上述条件,则考虑选择spearman系数或者kendall系数。
相关分析和回归分析的联系及区别
相关分析是回归分析的前提,回归分析是相关分析的进一步拓展。
分析步骤
相关图分析
相关系数
相关系数是对变量之间相关关系密切程度的度量
Pearson简单相关系数
在统计学中,皮尔逊积矩相关系数(Pearson product-moment correlation coefficient),有时也简称为PMCC,通常用r或是ρ表示,是用来度量两个变量X和Y之间的相互关系(线性相关)的,取值范围在[-1,+1]之间。皮尔逊积矩相关系数在学术研究中被广泛应用来度量两个变量线性相关性的强弱,它是由Karl Pearson在19世纪80年代从Francis Galton介绍的想法基础发展起来的,但是发展后原想法相似但略有不同的,这种相关系数常被称为“Pearson的r”。
Pearson线性相关系数只是许多可能中的一种情况,为了使用Pearson线性相关系数必须假设数据是成对地从正态分布中取得的,并且数据至少在逻辑范畴内必须是等间距的数据。如果这两条件不符合,一种可能就是采用Spearman秩相关系数来代替Pearson线性相关系数。
SPSS操作实例
1. 界面
2. 参数设置
3. 简单散点图
4. 结果分析
4.1散点图
4.2相关性
Person相关系数为0.112,且显著性水平为0.012,不相关的假设不成立
本期课程就到这里哦,感谢大家耐心观看!每日更新,敬请关注!
【杏花开生物医药统计】微信公众号(xhkdata)
相关文章(灰色区域可滑动)
● GraphPad Prism绘制生存曲线详细教程
● SPSS如何比较样本两组样本的组内和组间差异
● SPSS生存分析在生物医药统计中的应用之COX风险比例回归
● AMOS结构方程进行医学问卷量表分析教程
● SPSS生存分析在生物医药统计中的应用
● GraphPad Prism绘制柱状图
● SPSS中对问卷数据进行探索因子分析
● SPSS问卷数据统计分析之项目分析
● Excel进行线性回归模型分析的操作与结果解读
● Excel在统计分析中的应用之单因素方差分析
● Excel进行基础数据分析之VLOOKUP函数及透视表的应用
● Excel进行数据分析常用方法及函数汇总
● SPSS中常用的参数和非参数检验方法、基本原理和操作步骤
● ROC曲线在SPSS中的具体操作及医学和生物统计中的应用
● 一文读懂R语言如何实现逐步回归分析
● R语言中如何绘制散点图和箱线图?看完即会
● SPSS中的Variable数据变量类型介绍
|