权重曲线如何辅助业务分析

数据管道

共 3492字,需浏览 7分钟

 ·

2020-12-07 22:34


不好意思……我真的找不到合适的封面图了hhhhhh……


在上次整理完项目复盘的模板后,留言里有好几个小伙伴问我“活动前每日新增1000人,活动中每日也新增1000人,为什么说活动效果不一定差?”。


其实这里我借用了一点加权曲线的原理。


我们可以这样理解:

    每日新增人数


    = 自然增长基值 + 随机波动值 + 人为干扰波动值


对于电商来说,受到了工作日、寒暑假的影响,从周一到周日,从1月到12月都会呈现出不同的增长表现。想象一个电商公司:在平稳运营的过程中,不采取任何的活动措施,周日新增用户量往往大于周一。


一年365天里,每段时间的自然增长基值是不一样的。或者说,简化一下,周日和周一的自然增长基值是不一样的,可能周日的自然增长基值为1000,周一的自然增长基值为700。


周一推出了分享拉新的活动:假设极端情况下(忽略掉随机波动值的影响),周一和周日都新增了1000人,所以活动带来了300的人为干扰波动值,是有效果的。


当然了,要评估一个活动的效果,最好多看几天的数据,取平均值来对比。



我不知道你们对加权曲线是否感兴趣。


最近我在复盘加权曲线的逻辑和应用案例,整理了一份文档,有兴趣的接着看吧~看了不吃亏,也不上当(微笑)


在工作里,我借鉴了《数据化管理》中的加权曲线以及黄氏曲线,并在计算上做了简单的修改,让模型与业务的融合度更高。


有了黄氏曲线和权重曲线,我可以追踪业务线的日常销售情况,可以复盘营销活动,可以将财务目标拆解到每一个自然日上,可以进行销量的预测……


虽然有时候分析效果不尽人意,但有了这个思路逻辑的我,就像初上战场的小兵拥有了刀和剑,不至于在收到相关需求和分析任务时手忙脚乱。


不禁感慨,对我这种刚入门的小白来说,加权曲线是一个好东西……


直接上一个小小的case吧

 




计算权重曲线



在今天,我们很难找到一家店铺,或者说一家公司,一个行业,能够保持365天每天相差无几的销量。


抖音短视频:考虑到工作日学生上课,非学生上班,视频类APP普遍周末的活跃人数最多……


写字楼下的餐厅:考虑到写字楼中的白领往往周中上班,一定是工作日的销量更好……


迪士尼的门票:除了周末和法定节假日,游乐园一定会在寒暑假爆满……


一年365天,每天都会对一整年的业绩贡献力量。而作为数据分析师,我们需要从过往的业绩表现中寻找密码规律,权重曲线正是这一规律的体现。


▼ STEP 1 :计算日权重


(1)剔除掉特殊节假日,计算2-3年内,周一:周日的平均订单量,如下表:


星期X



日均订单

1000
1100
12501450150018001550


(2)选择最小值“星期日-100单”作为基值


当然,你也可以选择均值作为基值……主要还是根据计算出来权重曲线和业务的拟合度来选择合适的基值。


(3)对于非节假日,以日均订单/基值计算周日权重,如下表:


星期X



日权重1
1.1
1.251.451.5
1.81.55


(4)对于特殊节假日,以日订单/基值计算节假日权重,如下表:


节日标记
端午节前2天
劳动节第2天
清明节第1天
双十一活动
日均订单
1700
2300
35002900
日权重
1.7
2.33.5
2.9


(5)合并(3)和(4),得到365天每天对应的日权重值,如下图:



▼ STEP2:计算周权重(考虑长期波动)


在零售业、旅游业、餐饮业里,销量往往会存在季节性的波动。同样,在一个企业的快速增长期里,从年初到年末,销量也会有稳定的增长。


这时候,我们需要将周波动考虑进来,用以刻画全年的波动情况。一年有52个周,计算每个周的权重,即每个周在该年度订单中的贡献占比。


计算的逻辑和日权重相似:


(1)计算2-3年内,第1周-第52周的每周平均订单量


(2)选择最小值作为基值


(3)以周均订单量/基值计算周权重,得到365天每天对应的周权重值


    就像下面这张图:


▼ STEP3 :计算考虑长期波动的每日权重


考虑长期波动的每日权重=日权重*周权重


如下图:

导出了365天每天的权重,就像……在枪里装满了备用的子弹……


监控日常销售活动



如何利用我们计算出的每日权重值,来监控日常销售活动呢?


权重体现了每日的订单波动。


将每日的实际订单量/权重后,得到每日除权订单量,将每日除权订单量连接起来,也就是我们的权重曲线。


(1)在理想情况下,实际订单严格遵循波动比例,权重曲线会是一条水平的直线。表示忽略随机影响时,每天的订单仅受到趋势波动的影响,不受人为因素的影响,当然,这种情况是不存在的……



(2)在考虑随机波动的情况下,实际订单不会严格遵循波动比例,除权订单量围绕理想水平直线上下波动,是一条看上去还算水平的线。表示每天的订单量同时受到趋势波动和随机影响,表现相对稳定,不需要额外关注。



(3)在考虑特殊事件的情况下,比如往年只在双十一当天举行促销活动,但今年拉长了预售周期,活动时间为11月9-13日。在图中,我们也看见11月9-13日的除权订单量向上增长明显,打破了情况2下随机波动的相对平稳趋势。


我们认为,在除权订单量构成的曲线中,异常的凹凸波动,可以视为人为或者突发情况的干扰,需要给予重视。


量化特殊情况影响



用权重曲线能够表示订单的人为波动影响,但是凹凸不平……不够直观,所以可以借助黄氏曲线来展示更加直观的结果。黄氏曲线展示的是:一段时间内权重曲线的均值。


我们可以理解成,权重曲线用来跟踪销售;而黄氏曲线用来事后复盘特殊情况。将上面情况(3)的权重曲线处理一下,得到了黄氏曲线:

已知:

活动前:日均除权订单904


活动中:日均除权订单1237; 权重之和为10.22


活动后:日均除权订单940


计算出:


①活动带来的增量:[1237-(904+940)/2]*10.2=3213(单)


②活动带来的订单占比:259/11375=28.2%


③促销爆发度:(1237-904)/904= 36.8%


④促销衰减度:(1237-940)/904= 32.8%





其实在面试中,很少有面试官问出如此细致的问题。但问不到,并不代表我们可以放弃这一块的知识点逻辑。


曾经我也以为,数据分析是灵活的玩转python和R,精通算法模型。在遇到各种需求的时候,从神经网络到XGBOOST尝试一遍,最后给需求方送上一份最终的结果。


实际并非如此。因为凡是有点追求的需求方,在看见结果的时候,一定会问:“这指标怎么来的?”


当你大刀阔斧,颇费口舌的解释了一通后,人家仍然一脸疑问????——不好意思没听懂


有时候业务需要的,并不是什么高大上的算法,也不是精密的模型,只是希望你能说人话,至少让他们觉得你给出的结果符合业务逻辑。


从业务中来,到业务中去,用业务能听懂的逻辑,用业务能理解的分析框架,给她们提供结论和建议,也许才是双赢的结果。


在最开始学习数分的时候,我看了很多专业技术知识书,像《统计学习方法》、《利用python进行数据分析》、《大话数据结构》……


渐渐摸清面试规律后,又开始琢磨业务知识书,像《数据化管理》、《精益数据分析》……


而工作以来,不再局限于和“数据”相关的话题,相对轻松的工作环境给了我广泛阅读的时间和精力。我开始阅读我喜欢的,心理学&经济学&行为学相结合的书,像《乌合之众》、《思考快与慢》、《反脆弱》……也恰恰是许许多多的这些书,逐渐带着我以不同的角度去分析问题,偶尔颇有打开任督六脉的感觉。


我的leader总是告诉我,数据分析师最有价值的,并不是你写出的代码,也不是你给出的分析结论,而是刻在你脑子里的,属于你自己的分析框架。所以在每一个项目结束后,在每一份报告汇报完毕后,总会鼓励我进行细致的复盘,找到不同项目之间的思维共性。


最近复盘权重曲线框架的时候,我又重读了一遍《数据化管理》。突然发现“会员价值分析”和“竞品数据分析”两个章节,和我的工作内容也有些许的交叉……也许在提示我又可以继续整理分析框架了……


 有人跟我反映PDF不够清晰,我只能……给你们推实体书了。研二的时候我买了这本书,面试借用了里面的人货场理论,一路带到携程,没想到在工作中仍然发挥了余温……

·················END·················

推荐阅读

  1. 说说心里话

  2. 写给所有数据人。

  3. 从留存率业务案例谈0-1的数据指标体系

  4. NB,真PDF神处理工具!

  5. 超级菜鸟如何入门数据分析?


欢迎长按扫码关注「数据管道」

浏览 195
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报