配对数据一般是在实验时使用,而且配对数据的特点为:行数一定完全相等并且只有两列。
如果研究数据的行数不相等,那可能不是配对数据,如果还想对比差异,可能需要使用独立t 检验。
4、重复测量方差
重复测量数据是指同一批样本(病例)在不同的时间点测量了多次数据,因此重复测量数据的特殊之处在于一定会有ID号(即样本或者病例号),以及时间点数据。
如下图:同一个ID会有多个时间点的数据,比如下面有12个样本(12个ID号),并且测量5个时间点。那么就一定会有12*5=60行数据。同一个ID号会重复5次,同一个时间点会重复12次。
三、常用影响关系分析方法数据格式
1、多元线性回归
多元线性回归分析用于研究自变量X对因变量Y的影响关系情况,通常自变量个数不止一个,数据格式如下:
2、条件logit回归
条件logit(logistic)回归时,配对编号ID用于标识ID,而且是配对,因此一个ID会出现多次,比如1:1配对,那么1个ID就会出现2次(1:2配对时,1个ID就会出现3次);因变量Y一定只能包括数字0和1,类似数据格式如下图:
3、Possion回归、负二项回归
Poisson回归或负二项回归时,如果数据中带有基数,比如‘患癌症’人数是Y,而且患癌症人数是基于某个省而言,那么基数就是‘每省的人口总数’,类似数据格式如下图: