尔云间 一个专门做科研的团队
原创 小果 生信果
相关分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度,相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。
判断数据是否具有相关关系,最直观的方法就是绘制散点图
要判断多个数据的之间的关系,散点图的绘制就会显得比较繁琐,这时候要选择绘制散点矩阵
相关系数
相关系数衡量了两个变量的统一程度,范围是-1~1,‘1’代表完全正相关,‘-1’代表完全负相关。
比较常用的是Pearson‘皮尔逊’相关系数、Spearman‘斯皮尔曼’相关系数。
在R中,相关性分析的R包:
install.packages("corrplot")
网址:Visualize correlation matrix using correlogram - Easy Guides - Wiki - STHDA
下面小果将带大家用具体的例子来了解相关性的概念:
测试数据是ggplot2 包中自带的diamond 数据,每一行为一种钻石,每一列为钻石不同的属性,如carat (克拉), cut (切工), color (色泽), clarity (透明度) 等。
数据读进来后,怎么绘制呢?不要着急,小果将一步步带你学习。