最近在学习R语言,其中涉及涉及到关联分析时碰到的一些函数,其中有三个彼此关联的函数:
var:计算某个变量的方差
cov:计算两个变量的协方差
cor:计算两个变量的相关性
这些概念的理论学校里肯定都学过,不过现在确实是一点也想不起来了,而且更重要的是当时也不知道为什么要有这些统计概念。然后现在只得在度娘上搜了一下,共找到期望、方差、标准差、协方差和相关性。
期望值
在概率论和统计学中,一个离散性随机变量的期望值(或数学期望、或均值,亦简称期望,物理学中称为期待值)是试验中每次可能结果的概率乘以其结果的总和。换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。
在统计学中,当估算一个变量的期望值时,一个经常用到的方法是重复测量此变量的值,然后用所得数据的平均值来作为此变量的期望值的估计,平均数一般用μ表示。
在概率分布中,期望值和方差或标准差是一种分布的重要特征。
在经典力学中,物体重心的算法与期望值的算法十分近似。
方差
方差(Variance)又称为变异量或变异数,是应用数学中的一个概念。在概率论和统计学中,一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二阶中心动差,恰巧也是它的二阶累积量。方差的算术平方根称为该随机变量的标准差。方差的公式简单的可描述为变量的所有观测值与其期望之差的平方的总和再除以样本数量:
标准差
标准差(英语:Standard Deviation),数学符号σ,在概率统计中最常使用作为统计分布程度(statistical dispersion)上的测量。标准差定义为方差的算术平方根,反映组内个体间的离散程度;标准差与期望值之比为标准离差率。标准差的观念是由卡尔