商业数据分析案例:星巴克是如何优化促销活动的?

大数据DT

共 2528字,需浏览 6分钟

 ·

2022-02-12 08:21


导读:作为星巴克奖励系统的忠实粉丝(时不时给我免费早餐),我还挺好奇它到底是如何运行的。


比如,星巴克的数据科学家是如何通过选择不同的价格、产品、持续时间、内容等因素,组合出效果最好的促销活动。


今天我们就通过这篇分析,来尝试了解用户统计信息与促销活动之间的关系,并最大程度增加收入。


作者:Jae Beom Bae
译:之肴,编辑:肉松
来源:优达学城Udacity(ID:youdaxue)


01 目标

分析的目标是确定优惠信息和受众之间的重要关系。共有 10 个优惠,如下所示:

▲促销优惠

为了细分哪些受众与哪些促销有关,我们将对这10个优惠进行启发式分析和回归分析。

具体来说,我们要:

  1. 确定每个细分市场对哪些促销活动最为敏感
  2. 根据预期收入确定要发送给每个细分市场的促销信息


02 第 0 部分:预处理和探究

任何数据分析的第一步都是检查数据集的质量并进行预处理,以解决那些可能导致分析混乱的问题。

观察数据可以发现十分奇怪的一点,有一大批用户的年龄显示为“118”,这些用户也碰巧没有指明收入的值。我的猜测是,因为缺少相关的年龄和收入数据,所以只有在考虑性别对购买行为的影响时才用得上这些数据。


又因为我们只考虑年龄和收入,不包括性别,所以我将这些数据排除在分析之外。在仔细观察数据集的大小和分布之后,我认为最合适的细分方法是按年龄组和性别进行划分。尽管从技术上讲我们可以进一步细分(例如按收入、加入日期),但分到这一步就已经能很好地理解两者的关系。


除此之外,还可以执行一些其他的数据预处理方法,确保数据集便于分析,包括:

  • 将分类变量转为虚拟变量(dummy variable)
  • 统一日期格式
  • 从数据中提取特征
  • 进行特征工程以确定细分条件


03 第 1 部分:促销敏感程度

为了确定每个细分市场对 10 个优惠的敏感程度,我们需要观察优惠被查看后的购买情况,这其中不包括用户没看到优惠但依然购买的情况,也就是说他们总得花那么多钱。

▲不同人群的购买情况

综上所述,有几个关键点:

1. 一般情况

  • 在所有细分市场中,优惠5–8响应率很高,这些也都碰巧是通过社交渠道(以及网络、电子邮件、移动设备)提供的优惠。
    可以把社交渠道单拎出来验证它是不是会对反应率造成影响。
  • 优惠7的整体响应率特别高,而且它就是一个优惠的通知信息。
    但是和同类的优惠2相比,响应率存在明显差异——这进一步强调了社交渠道的有效性
  • 难度最高(10天之内最低消费为20美元)且奖励最高(5美元折扣)的优惠4的整体响应率最低,这很可能是由于只通过网络和移动设备发送的关系

2. 细分市场

  • 女性细分受众群(2、5、8、11)的平均响应率比男性细分受众群的更高,尤其是那些通过移动设备和社交渠道传播的优惠。
  • 细分1(千禧一代,男性)的响应率特别低(40%左右,而其他大多数都> 50%)。
  • 其他性别的细分(3、6、9、12)的响应率分布情况大为不同,这很可能与样本量极低有关。

总结来说,高响应率与通过社交渠道(尤其是女性群体)提供的优惠有关。


04 第 2 部分:哪种促销?

由于促销响应程度只是整个分析的一部分,因此我们需要更好地了解每个细分市场的财务情况所造成的影响。为了评估财务指标,需要进行回归分析。

从考虑的候选模型中,2阶多项式最为合适,因为它的训练和测试得分相对较高。


通过使用2阶多项式回归,我确定了每个细分受众群对优惠最多肯花多少钱:


最后我针对每个细分市场得出了热门优惠:


从这些结果中我们可以认识到:

  • 优惠4(5 美元折扣、10 天内花 20 美元)对大多数细分市场最为有效。
  • 一般来说,优惠 0、1 和 9效果也很好,紧随优惠4之后。
  • 前十种优惠的优惠类型不是“折扣”就是“买一送一”,几乎均等。
  • 收入与支出金额为正相关关系,与直觉相符。
  • “沉默的一代”细分市场预期收益最高,其次是“婴儿潮”和“千禧一代”。
    (“沉默的一代”:二十世纪二十年代中期至四十年代早期出生的人, “婴儿潮”:1946-1964年出生的人,“千禧一代”:八十年代早期至九十年代中期出生的人)


总的来说,高潜力的优惠(优惠4)可能由于其传播渠道和目标人群的选择而表现不佳。


05 结论

该分析提供了一些重要的看法,有助于缩小未来的分析范围和制定总体促销策略。

根据目前的优惠组合,最好的促销策略是向高收入女性(尤其是“千禧一代”和“沉默的一代”)提供优惠0和优惠1,因为她们的优惠购买率高,而且预期支出也相对较高。

但是,在制定强有力的促销策略之前,还得做一些其他实验和分析,其中包括:

  1. 验证购买率和传播渠道之间的关系。
  2. 具体来说,如果通过社交渠道提供优惠4(最高回报,最低购买率)会发生什么?
  3. 对于每个细分市场,要发送的优惠的最佳组合是什么?
  4. 探究“意外购买”(没查看优惠,但依然购买)的价值——它是否会导致未来的支出行为发生变化吗?
  5. 进行类别分析(例如K-Means聚类)来验证、确认识别出的细分市场。
  6. 有什么方法可以提高男性的购买率(因为他们的预期支出很高)?
  7. 用更大的样本数据对其他性别(3、6、9、12)进行细分。

原文:
https://towardsdatascience.com/starbucks-promotion-optimization-ca56e29fb584


延伸阅读👇


延伸阅读《利用Python进行数据分析


干货直达👇



更多精彩👇

在公众号对话框输入以下关键词
查看更多优质内容!

读书 | 书单 | 干货 | 讲明白 | 神操作 | 手把手
大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化
AI | 人工智能 | 机器学习 | 深度学习 | NLP
5G | 中台 | 用户画像 数学 | 算法 数字孪生

据统计,99%的大咖都关注了这个公众号
👇
浏览 4
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报