04
协方差
以上几个概念理解了后,下面再阐述什么是协方差,字面上看它比方差多一个协字,那么大体也能猜出,它可能是衡量两个随机变量间是不是存在某种关系的。
那么它的实际定义如下:
其中,
X, Y 是两个随机变量
是对应两个随机变量的均值
如果两个变量是高度同向的,即X变大,Y也变大,那么对应的协方差也就很大;如果每次X变大,Y就变小,那么X和Y的协方差可能就会为负数
例如,经过观察,我们发现小明的数学成绩和物理成绩的分数分布情况高度相符,也是70分以下3次,80~90分居多,21次,90分以上1次,那么我们就说小明的数学和物理成绩的协方差很大。
05
相关系数
我们考虑具有一般性的公式,通常相关系数的定义如下:
发现这个相关系数与协方差紧密相关,只不过又除以了X的标准差和Y的标准差,也就是说,是一种剔除了X和Y这两个偏离程度量纲的影响,标准化后的特殊协方差。
同样可以拿协方差来理解相关系数,若相关系数很大,则可以得到X变大,Y也很可能会变大的结论。