今天将各个模块中,具有代表性的分析方法的数据格式进行一个汇总说明,本文主要介绍以下内容:
一、规范格式说明
1、原始数据格式
我们在进行数据分析时,最常见的数据格式是原始数据格式。
下图是一份常见的原始数据,它的特点是:一行代表一个样本,一列代表一个属性(变量)。
原始数据格式的特点是,调查有多少样本,就需要录入多少行数据;如果调查了500个样本,那么就需要录入500行数据。每一行代表每个样本收集的所有数据,每一列代表每个属性(变量)的所有数据。
2、加权数据格式
除原始数据格式外,还有一些分析方法还会使用到加权数据格式,在医学/实验研究中,很多时候只有汇总数据,即带加权项的数据,如卡方检验等。下图为卡方检验的加权数据,加权数据格式的特点是:基本只针对全部为定类数据的研究时使用,且只提供汇总数据,不提供原始数据。