统计分析意味着使用定量数据调查趋势、模式和关系。它是科学家、政府、企业和其他组织使用的重要研究工具。
为了得出有效的结论,统计分析需要从研究过程的一开始就进行仔细的规划。在分析时,需要先指定假设,并就研究设计、样本量和抽样程序做出决定。
从样本中收集数据后,可以使用描述性统计来组织和汇总数据。然后,使用推论统计量来正式检验假设并对总体进行估计。最后,解释和概括发现。
该篇文章是统计分析的实用介绍。在此,将使用两个研究示例展示相应步骤。第一个研究潜在的因果关系,而第二个研究变量之间的潜在相关性。
示例1:因果研究
冥想可以提高青少年的考试成绩吗?
示例2:相关研究
父母收入和大学平均绩点 (GPA) 之间有关系吗?
Step1:确定假设并规划研究设计
要收集有效数据进行统计分析,首先需要确定假设并规划研究设计。
撰写统计假设研究的目标通常是调查总体中变量之间的关系。从预测开始,然后使用统计分析来测试该预测。
统计假设是编写总体预测的正式方法。每个研究预测都被重新表述为可以使用样本数据进行检验的零假设和备择假设。
虽然原假设始终预测变量之间没有效应或没有关系,但备择假设陈述了您对效应或关系的研究预测。
示例1:用于检验效果的统计假设
原假设:5 分钟的冥想练习对青少年的数学考试成绩没有影响。
备择假设:5 分钟的冥想练习将提高青少年的数学考试成绩。
示例2:用于检验相关性的统计假设
原假设:在大学生中,父母收入和GPA之间没有关系。
备择假设:大学生的父母收入和 GPA 呈正相关。
研究设计规划
研究设计是收集和分析数据的整体策略,决定了以后可用于检验假设的统计检验。
首先,确定研究的属性,是使用描述性、相关性,还是实验性设计。实验直接影响变量,而描述性和相关性研究仅测量变量。
- 在实验设计中,可以使用比较或回归的统计检验来评估因果关系(例如,冥想对考试成绩的影响)。
- 在相关性设计中,可以使用相关系数和显著性检验来探索变量之间的关系(例如,父母收入和 GPA),而无需假设任何因果关系。
- 在描述性设计中,可以使用统计检验从样本数据中得出推论,从而研究人群或现象的特征。
研究设计还涉及在小组层面还是个人层面比较参与者,还是两者兼而有之。
- 在受试者间设计中,比较接受过不同治疗的参与者(例如,进行冥想练习的参与者与未进行冥想练习的参与者)的组水平结果。
- 在受试者内设计中,比较参与研究所有治疗的参与者的重复测量值(例如,进行冥想练习前后的分数)。
- 在混合(因子)设计中,一个变量在受试者之间改变,另一个变量在受试者内部改变(例如,做过或没有做过冥想练习的参与者的前测和测后分数)。
示例1:实验研究设计
设计了一个受试者内实验来研究 5 分钟的冥想练习是否可以提高数学考试成绩。研究对一组参与者进行了重复测量。
首先,需要获取参与者的基线测试分数。然后,参与者将进行 5 分钟的冥想练习。最后,记录参与者在第二次数学测试中的分数。
在这个实验中,自变量是 5 分钟的冥想练习,因变量是干预前后的数学测试分数。
示例2:相关研究设计
在相关研究中,测试即将毕业的大学生的父母收入与 GPA 之间是否存在关系。为了收集数据,要求参与者填写一份调查问卷并自我报告他们父母的收入和他们自己的 GPA。
本研究中没有因变量或自变量,因为测量变量而不以任何方式影响它们。
测量变量在规划研究设计时,应该操作变量并准确决定如何测量它们。
对于统计分析,重要的是要考虑变量的测量级别,包含哪些类型的数据:
- 分类数据表示分组。这些可以是名义上的(例如,性别)或序数(例如语言能力水平)。
- 定量数据表示金额。这些可能是区间量表(例如测试分数)或比率量表(例如年龄)。
许多变量可以在不同的精度水平下进行测量。例如,年龄数据可以是定量的(8 岁)或分类的(年轻)。如果一个变量是以数字方式编码的(例如,1-5 的一致性级别),这并不自动意味着它是定量的而不是分类的。
确定测量水平对于选择适当的统计量和假设检验非常重要。例如,您可以使用定量数据计算平均分数,但不能使用分类数据。
在研究中,除了感兴趣的测量变量外,通常会收集有关相关参与者特征的数据。
示例1:变量(实验)
可以使用定量年龄或测试分数数据执行许多计算,而分类变量可用于确定比较测试的分组。
示例2:变量(相关研究)
相关研究中的变量类型决定了将用于相关系数的检验。参数相关性检验可用于定量数据,而如果其中一个变量是有序变量,则应使用非参数相关性检验。
(待续)