数据收集是收集观察或测量结果的系统过程。无论是出于商业、政府还是学术目的进行研究,数据收集都能可以让研究人员获得第一手知识和对研究问题的原始见解。
在百度百科上,所给出的数据收集定义是:指根据系统自身的需求和用户的需要收集相关的数据。
虽然各领域的方法和目标可能不同,但数据收集的整个过程基本相同。在开始收集数据之前,需要考虑:
- 研究目的
- 收集的数据类型
- 用于收集、存储和处理数据的方法和程序
要收集与研究目的相关的高质量数据,请执行以下四个步骤。
Step1:确定研究目标在开始数据收集过程之前,研究人员需要准确确定要实现的目标,可以从写一个问题陈述开始:想解决的实际或科学问题是什么,为什么它很重要?
接下来,制定一个或多个研究问题,准确定义想要了解的内容。根据研究问题,可能需要收集定量或定性数据:
- 定量数据以数字和图表表示,并通过统计方法进行分析。
- 定性数据用文字表达,并通过解释和分类进行分析。
如果研究目标是检验假设、精确测量某事或获得大规模的统计见解,请收集定量数据。如果研究目标是探索想法、理解经验或详细了解特定环境,请收集定性数据。如果研究有多个目标,则可以使用混合方法方法收集这两种类型的数据。
示例:研究大型企业中员工对直属经理的看法,可采用定量和定性研究方法收集收集
研究的首要目标是评估不同部门和办公地点对经理的看法是否存在显着差异。
研究的第二个目标是从员工那里收集有意义的反馈,以探索管理者如何改进的新想法。
由此,决定使用混合方法收集定量和定性数据。
Step2:选择数据收集方法根据研究要收集的数据,确定哪种方法最适合您的研究。
- 实验研究主要是一种定量方法。
- 访谈、焦点小组是定性方法。
- 调查、观察、二手数据收集可以是定量或定性方法。
仔细考虑将使用哪种方法来收集数据,以帮助直接回答研究问题。
方法 | 何时使用 | 如何收集数据 |
实验 | 测试因果关系。 | 控制变量并衡量它们对其他变量的影响。 |
调查 | 了解一群人的一般特征或意见。 | 在线、亲自或通过电话将问题列表分发给示例。 |
访谈/焦点小组 | 深入了解对某个主题的看法或意见。 | 在个人访谈或焦点小组讨论中口头向参与者提出开放式问题。 |
观察 | 在自然环境中理解某事。 | 在不试图影响样本的情况下测量或调查样本。 |
档案研究 | 了解当前或历史事件、条件或做法。 | 从图书馆、托存处或互联网访问手稿、文件或记录。 |
二次数据收集 | 分析无法直接访问的人群中的数据。 | 查找已从政府机构或研究机构等来源收集的现有数据集。 |
当知道正在使用哪种方法时,需要准确计划如何实现它们。研究人员将遵循哪些程序来准确观察或测量感兴趣的变量?
例如,如果研究人员正在进行调查或访谈,请决定问题将采取何种形式;如果研究人员正在进行实验,请对实验设计做出决定(例如,确定纳入和排除标准)。
操作化
有时,变量可以直接测量:例如,研究人员只需询问出生日期即可收集员工平均年龄的数据。
操作化意味着将抽象的概念概念转化为可衡量的观察结果。在规划如何收集数据时,您需要将要研究的内容的概念定义转换为实际测量内容的操作定义。
示例:决定使用调查来收集定量数据。研究要衡量的概念是管理者的领导力。研究人员可以通过两种方式实现此概念:
- 研究人员要求经理们用 5 分制来评价他们自己的领导技能,评估授权能力、果断性和可靠性。
- 研究人员要求他们的直接员工就相同的主题向经理提供匿名反馈。
使用单个概念的多个评级可以帮助研究人员交叉检查数据并评估度量的测试有效性。
抽样
在研究中,研究人员需要制定抽样计划以系统地获取数据。
研究所采用的抽样方法将决定如何招募参与者。要决定抽样方法,需要考虑所需的样本量、样本的可访问性和数据收集的时间范围等因素。
标准化程序
如果涉及多个研究人员,请编写一份详细的手册,以标准化研究中的数据收集程序。
这意味着制定具体的分步说明,以便研究团队中的每个人都以一致的方式收集数据——例如,在相同条件下进行实验并使用客观标准来记录和分类观察结果。这有助于您避免常见的研究偏差,例如遗漏的变量偏差或信息偏差。
这有助于确保数据的可靠性,并且还可以在将来使用它来复制研究。
创建数据管理计划
在开始数据收集之前,还应该决定如何组织和存储数据。
- 如果您研究人员人们那里收集数据,可能需要匿名化并保护数据,以防止敏感信息(例如姓名或身份证号码)泄露。
- 如果通过访谈或纸笔格式收集数据,则需要以系统的方式进行转录或数据输入,以尽量减少失真。
- 研究人员可以通过定期备份组织系统来防止数据丢失。
最后,研究人员可以实施选择的方法来获取数据。
示例:收集定性和定量数据的是为了收集有关经理看法的数据,因此需要对不同部门、不同地点地点的公司员工进行包含封闭式和开放式问题的调查。
封闭式问题要求参与者以 1-5 的等级对经理的领导技能进行评分。生成的数据是数值,可以对平均值和模式进行统计分析。
开放式问题要求参与者举例说明经理现在做得好的地方以及他们将来可以做得更好的地方。生成的数据是定性的,可以通过内容分析进行分类,以获得进一步的见解。
为确保以系统的方式记录高质量的数据,以下是一些最佳实践:
- 在获取数据时记录所有相关信息。
- 仔细检查手动数据输入是否有错误。
- 如果您收集定量数据,研究人员可以评估信度和有效性,以保证数据质量。