一、什么是数据分析数据分析作为各种业务找到问题的核心,需要定位问题,找出解决的方案。本文结合具体案例,总结数据分析在产品中的应用以及相关方法论,希望对你有所帮助。
数据分析的核心是是利用数据发现问题,定位原因,找到解决方案或提出建议的思维,所以分析工具并不是最重要的,也不需要一开始就学Python、爬虫等;对非专业人士来说,其实用Excel就能够满足大部分日常诉求。
数据分析3要素:数据、统计/分析方法、结论。
1)没有准确、丰富的数据,无法进行分析;
2)没有恰当的方法、工具,很难对数据进行加工、找到其中的规律;
3)没有形成结论,则相当于没有结果,半途而废,数据价值大打折扣;
二、数据分析应用案例举一个数据分析在产品工作中“发现问题-设定假设原因-验证原因-解决问题”的例子;
【分析过程】
第一步:拆解指标
净利润额=总销售额-总退费额-总成本
总退费额=退费客户数平均退费金额=(总购买客户数退费率)* 平均退费金额
通过拆解,可以发现总购买客户数、退费率、平均退费金额都是影响总退费额的因素,为了进一步明确原因,需要辅助数据分析手段。
第二步:发现问题——如何发现问题?
拉取最近一年的退费明细订单数据,汇总加工处理后,发现问题:【缴纳定金后退费】金额占总退费金额比例不到5%,而【缴清全款后退费】占比高达95%。
明显后者退费占比异常偏高,所以我选择继续下钻分析【缴清全款后退费】的数据,并尝试罗列出明显规律:
1)学生完课率越高,退费率越低;完课率与退费率呈现负相关;
2)未上课退费、已上课退费分别占比 70%、30%比例;
3)已上课退费中,按已上课次-平均退费金额进行分布统计,发现两者呈现负相关,已上课次越多,退费订单数越少,且退费金额越少。
第三步:明确核心问题——什么是最核心的问题?
从第二步来看,未上课退费、已上课退费均有可优化的空间,并且一些维度之间存在正向或负向的影响关系,为了让逻辑看起来更清晰,我尝试建立各个维度之间的关系(相关关系or因果关系?),来帮助决策明确核心问题。