常用数据分析的九种方法,数据分析六大基本步骤

首页 > 健康 > 作者:YD1662022-12-09 00:22:18

常用数据分析的九种方法,数据分析六大基本步骤(1)

作为新手数据分析师或数据运营,在面对数据异常的时候,好多小伙伴都会出现:“好像是A引起的” ,“好像也和B渠道有关”,“也可能是竞争对手C做了竞争动作”等主观臆测。面对数据报表,也不知道应该从产品维度、时间维度、地域维度还是渠道维度去拆分。很显然,这样的思维是乱的,所以做数据分析很重要的一点是:要具备结构化的分析思维

01分析思维

一、结构化思维:结构化思维让你分析效率加倍
相信很多人都听说过“金字塔原理”。那额我们就来了解一下基于金字塔原理衍生的“结构化思维”吧。

什么是结构化思维?
结构化思维是指一个人在面对工作任务或者难题时能从多个侧面进行思考,深刻分析导致问题出现的原因,系统制定行动方案,并采取恰当的手段使工作高效地开展,取得高绩效。

让思维结构化的方法有哪些?
面对难题时,把你的思维结构化,然后拆解这个难题,最后完美解决。
但是如何才能让思维结构化?芭芭拉在《金字塔原理》一书中给出了两种方法。
方法一:自上而下找结构
当我们面对一些熟悉的领域或者习得了一些“套路”,脑子里就会冒出一些结构框架,这时我们只要顺着这些框架往下分解就很容易得到一套完整的结构图。
方法二:自下而上找结构
个人的知识体系总是有限,更多时候,让我们伤脑筋的问题来自于自己不熟悉的领域,例如我们分析师每天在解决的各种问题。
所以当我们面对一个问题毫无头绪时,怎么去建立出一个清晰完整的结构?从哪里突破?这时就需要用到自下而上找结构的方法,个人认为这也是结构化思维最具价值的地方。
以下四个步骤让思维结构逐渐清晰:
第一步:信息归类
第二步:信息分组
第三步:结构提炼
第四步:完善结构

二、公式化思维&费米问题

什么是公式化思维?
在结构化的基础上,列举的论点往往会存在一些数量关系,使其能进行+、-、×、÷的计算,将这些论点进行量化分析,从而验证论点。所谓指标体系,就是这么梳理得来的。
公式化分析思维意味着:上下互为计算(一切结构皆可量化)、左右呈关联(最小不可分割)。

常用数据分析的九种方法,数据分析六大基本步骤(2)

什么是费米问题?
费米问题,即估算问题,由美国科学家恩利克·费米提出。
费米问题的具体步骤:
1.明确问题
2.问题拆解
3.明确常识性数据
4.设计计算公式
5.计算得出结论

费米问题实际上是通过将复杂问题不断拆分为较容易获得数据的子问题,再通过获得子问题的数据从而得到看似毫无头绪的主问题的结论。
案例:芝加哥有多少位钢琴调音师?
钢琴调音师数量 = 全部钢琴调音师1年的总工作时间 / 一位调音师每年工作时间
“全部钢琴调音师1年的总工作时间”又可以拆解成3个子问题解决:
①芝加哥有多少架钢琴?
②钢琴每年要调几次音?
③调一次得多长时间?
∴ 钢琴调音师数量 = 全部钢琴调音师1年的总工作时间 / (①×②×③)
以上数据可以进行估算,最后得到结论,是不是很简单呢?

三、相关思维
什么是相关思维

常用数据分析的九种方法,数据分析六大基本步骤(3)

相关思维是比较复杂的统计学数据思维,相关思维包含正相关、负相关、非线性相关、不相关等多种类型,大部分应用在生物学、科学领域。复杂的相关分析需要应用函数,建模才能完成。

相关思维大部分应用主要研究A与B之间的关系,如销售额与UV之间的关系,广告费用成本与获取曝光量之间的关系。应用好相关思维,当我们在处理复杂问题的时候,能帮助我们刨除无关数据的干扰,找到关键的因素和指标解决问题。

但是需要注意的是不要混淆相关关系和因果关系,即因为事件A和事件B存在某种关联影响,解读成因事件A导致了事件B的发生。

相关分析经典案例:啤酒与尿布

啤酒与尿布的故事,是一个相关分析的经典案例。这个故事产生于20世纪90年代的美国沃尔玛超市中,当时沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。

经过大量实际调查和分析,揭示了一个隐藏在「尿布与啤酒」背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。

产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

四、时间序列和对比思维

什么是时间序列思维?

时间序列也称动态序列,是指将某种现象的指标数值按照时间顺序排列而成的数值序列。

大量的社会经济统计指标都是依据年、季度、月、日,甚至实时(秒)统计的,因此,时间序列是某个统计指标(变量)长期变动的数值表现。

很多时候,我们都用时间维度的对比来分析问题,比如同比、环比、定基比。
时间序列的思维有三个关键点:
一是距今越近的时间点,越要重视(图中的深浅度,越近期发生的事,越有可能再次发生);
二是要做同比(图中的尖头指示,指标往往存在某些周期性,需要在周期中的同一阶段进行对比,才有意义);
三是异常值出现时,需要重视(比如出现了历史最低值或历史最高值,建议在时间序列作图时,添加平均值线和平均值加减一倍或两倍标准差线,便于观察异常值)。

常用数据分析的九种方法,数据分析六大基本步骤(4)

首页 123下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.