我的数据正态性检验P<0.05,就不能用均数和标准差描述,不能用t检验和F检验了吗”。其实,也没有不那么绝对。
实际统计策略方面,诸位可以将数据分布分为三类:正态分布、近似正态分布数据和严重偏态分布数据。
第1类:正态分布符合,P>0.05;
第2类:正态分布不符合,P<0.05,但直方图还是呈现大致的中间多两边少,无严重极端值;
第3类:正态分布不符合,P<0.05,数据严重偏态,或者存在明显极端异常值这个数据,满足我上文讲的第二类分布。它虽然P<0.05,但是是典型的近似正态分布,在统计描述上,可以用均数及标准差描述,用t检验和F检验进行统计推断,
总结来说,判断数据正态性,需要结合直方图和正态性检验,将数据分布分为三大类,在此基础上分别选择不同的统计方法进行统计描述和统计推断。
不过,要略显麻烦的是,这种近似正态没有标准来判定,是经验之谈。初学者判定的时候,如果遇到十分模棱两可的图,可以视为严重偏态分布。