二、缺失值
1、完全数据法(适用:样本量较大,缺失值比例较少(<5%))
2、缺失数据标记法
3、缺失值插补法
①单值插补((优点:简单易操作)
单值插补法包括均值((用于正态连续变量)、中位数(偏态连续变量)、众数(分类变量)插补末次数据截转法、最佳数据截转法、最差数据截转法。
②多重插补
包括线性回归、预测均数匹配、倾向性评分、Logistic回归、判别函数、马尔科夫链蒙特卡洛、全条件定义。
统计模型中有哪些常用的统计方法?
一、群组效应
目的:控制群组效应。
常用广义估计方程(GEE)、混合效应模型二、竞争风险模型
①估计每个事件累积发生率(CIF), Gray's进行组间差异检验;
②原因别风险函数、部分分布风险函数。
文献一:Clopidogrel with Aspirin in Acute Minor Stroke or Transientlschemic Attack(CHANCE):1-Year Outcomes
影响因子:23.054
采用了三个统计模型,依据不同亚组人群的划分,分别估计氯毗格雷 阿司匹林对比单用阿司匹林预防卒中复发的效果。
文献二:A Multicenter Observational Study of Incretin-based Drugsand Heart Failure
影响因子:70.67
1、排除服用噻唑烷二酮的对象;
2、分析参照组为二甲双肌联合磺脲类的疗法。
目的:排除因服用噻唑烷二酮可能导致参照组风险增加的情况。
文献三:Association between tea consumption and risk of cancer: aprospective cohort study of 0.5 million Chinese adults
影响因子:6.529