一个双十一销售额预测方法和思路

数据D江湖

共 1516字,需浏览 4分钟

 ·

2021-11-11 12:57

马上又是双十一了,很多小伙伴估计都在加班备战。这时查数姑们,很有可能被问到:来预测下双十一的销售额,怎么办呢?今天分享个懒人心得。

注意:如果预测的时候,有很多数据可以用,还是有可能预测准确的,但是更多情况下,都是领导扔过来几个过往几年的数字,类似下边这种,然后让我们预测。数字这么少,怎么办呢?


只能死马当活马医了。走起!

预测基本思路

预测分作四步
  • 1.选择模型
  • 2.训练模型
  • 3.检验效果
  • 4.得出结论
我们一步步来

第一步:选择模型
预测有两种基本方法:
1.基于因果关系的预测,比如已知客户的人数、喜好、需求来预测销量
2.基于时间序列的预测,比如已知过去几年销售结果,推测下一年
边的问题里,显然只有孤零零的几个过往年份的数字,因此只能用时间序列预测啦。

时间序列预测有三种基本时间形态(如下图)


这个数据显然更符合趋势型特点,那就直接用趋势拟合搞起。

第二步:训练模型
数据少的情况下,直接用excel的趋势线拟合。拟合的时候注意:判断拟合曲线是否合理,并不是只看R平方,而是要关注拟合出的曲线是否符合真实走势,因此以下四种明显不符合走势的,可以直接排除掉(如下图)


留下三种相对看着靠谱的进行检验(如下图)


第三步:检验效果
把公式写好,可以计算出历年的拟合数据,与预测整体的MSE值,之后选择一个MSE值较小的。计算结果如下:


看起来乘幂的结果相对靠谱,那么就用这个公式吧

第四步:得出结论
代入乘幂的计算公式,可以得出2021年(第13期数据)的预测结果。


后记

那么是不是这么预测的就可以交差了呢?当然不是!稍微细心一点的小伙伴就会发现:用乘幂的预测结果,历史数据都不是很准!只有2020年一年误差小于10%,剩下几年都是百分之好几十的误差,根本不靠谱吗。


为什么会这样?因为牢记预测的基本原理:所有的预测,都是假设过去的情况未来会再度出现。而事实并没有这么简单。

比如我们把天猫历年双十一的数据做一个对比,计算期历年同比增长率,会发现:这里有明显3个趋势:
  • 趋势1:2010到2013年,极其快速发展(意味着需要用乘幂/指数预测)
  • 趋势2:2014到2019年,增长趋稳(意味着可以用多项式/线性预测)
  • 趋势3:2020年,突然暴涨(其实是因为改了规则,实际上统计的是11月1到11日的销量,理论上已经不能和历史数据合并预测,但是死马当活马医吗


所以在现实中,是很难用一套模型来预测各种情况的,特别是改了规则的情况下,更无法准确预测。理论上,如果有比如购买用户数,购买用户在各品牌/商品品类分布,重复购买率等进一步的数据,是可以尝试其他预测方法的,但好死不死,并没有这些数据,所以也就只能这样了。

这些问题都在提醒小伙伴们:不要盲目迷信所谓模型,模型本身没有什么神奇的力量,多收集数据,掌握真实准确的数据才是王道。

当然可能有小伙伴会说:你都不多做几个变量,搞搞逐步回归,提升下效果什么的吗。额,这篇本来就是懒人攻略吗。有精力的小伙伴们可以再试试哦,期待大家做的更好。

--------   往 期 推 荐  ----------
浏览 20
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报