用Excel进行简单的相关分析,通常包括以下 3 个步骤:
需要注意的是,相关性不等于因果性。两个变量之间相关性,并不代表其中一个变量的改变,是由另一个变量的变化导致的。
比如说,分析发现,国家的诺贝尔奖数量,与巧克力消费量之间呈现正相关关系,但这并不是说,多吃巧克力有助于获得更多的诺贝尔奖。一种合理的解释是,诺贝尔奖的数量与巧克力的消费量,很可能都是由其他变量导致的,例如国民的受教育程度和富裕程度。
六、溯源影响因素:归因分析实际业务中,很多问题的出现并非是单个因素造成的,而是经过多种因素的影响而共同造成的。
所以数据分析最头秃的问题就是:导致问题的原因到底是什么?归因分析(Attribution Analysis)要解决的问题就是多因素影响的情况下,最终效果的提升/下降,应该如何合理地分配给过程中的各个因素。
小虎在手机上看到了朋友圈广告发布了最新的iPhone,午休的时候刷抖音看到了有网红在测评这款手机,下班在地铁上刷朋友圈的时候发现已经有小伙伴收到手机在晒图了,于是喝了一杯江小白壮壮胆回家跟老婆申请经费,最后老婆批准了让他去京东买,有保障。那么请问,朋友圈广告、抖音、好友朋友圈、京东各个渠道对这次成交分别贡献了多少价值?
现实情况往往是很复杂的,在衡量其贡献价值时,只依靠单渠道归因分析得到的结果是不科学的,需要引入多渠道归因分析。常见的多渠道归因分析模型如下:
- 末次归因模型:将功劳100%分配给成交前的最后一个环节
- 首次归因模型:将功劳100%分配给第一个环节
- 线性归因模型:将功劳平均分配给过程中的每个环节
- 时间衰减归因模型:距离最终结果时间越短的环节,可以获得越多的权重
- 位置归因模型:第一次和最后一次环节各贡献40%,中间的所有环节平分剩下的20%贡献
- 自定义模型:根据自身业务的需求,自定义各环节分配比例
没有完美的归因分析模型,任何模型都存在它的局限性和不足,如何有效地结合使用场景和模型特点是用好归因模型的前提。
七、预测变化趋势:预测分析了解完问题的现状,定位到问题的原因后,我们还需要预测问题接下来的发展趋势。
另一方面,在各行业各领域,只要有核心的业务指标,都要预测核心业绩未来的走势,销售,市场营销,运营,财务等,一方面可以对未来的发展趋势有个大致的掌握,另一方面也可以提前规划,设定各子部门的KPI,以便尽可能地完成或者超过KPI,所以,如何准确地预测核心指标的变化趋势非常重要。
什么是预测?用最简单的术语来说,它是在分析过去和现在的数据,进而预测未来的过程。我们主要根据时间序列数据进行定量预测。我们通过一个案例说明时间序列数据的主要组成。
如下是各年搭乘飞机飞行乘客数量的趋势。
- 趋势性:趋势是事物发展或变化的总体方向。在上面的例子中,我们看到时间序列呈增长趋势,这意味着在搭乘飞机飞行的乘客数量整体趋势上是在增加。如下图中第一张图所示。
- 季节性:在上述时间序列中可以看到的另一个清晰的模式,就是该变化趋势以固定的时间周期重复,我们称为季节性。在特定时间周期内重复出现或重复的时间序列中任何可预测的变化模式都可以说是季节性。下图中第二张图所示。
- 随机性:去除趋势性和季节性后,剩下的就是一些随机的、无任何规律的白噪声。下图中第三张图所示。
时间序列预测的模型有很多,主要归为以下2类:
(1)传统预测方法
- AR(Auto Regressive Model)自回归模型
- MA(Moving Average Model)移动平均模型
- ARMA(Auto Regressive and Moving Average Model)自回归移动平均模型
- ARIMA(Auto Regressive Integrate Moving Average Model)差分自回归移动平均模型等
(2)现代预测方法
基于机器学习方法、深度学习的预测方法。对于机器学习方法,xgboost,随机森林及SVM这些都是可以用的,也没有说哪个模型好用,需要看具体的场景及实验,总之就是看效果说话。
(3)用Excel也能做预测
黑猫白猫,能抓住老鼠的就是好猫,不需要复杂的算法和模型,用Excel也能做简单的预测。
以上就是产品、运营工作中7种常见的数据分析方法的内容。
本文由@数据分析星球 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。