商业数据分析案例:星巴克是如何优化促销活动的?
导读:作为星巴克奖励系统的忠实粉丝(时不时给我免费早餐),我还挺好奇它到底是如何运行的。
比如,星巴克的数据科学家是如何通过选择不同的价格、产品、持续时间、内容等因素,组合出效果最好的促销活动。
今天我们就通过这篇分析,来尝试了解用户统计信息与促销活动之间的关系,并最大程度增加收入。
确定每个细分市场对哪些促销活动最为敏感 根据预期收入确定要发送给每个细分市场的促销信息
将分类变量转为虚拟变量(dummy variable) 统一日期格式 从数据中提取特征 进行特征工程以确定细分条件
在所有细分市场中,优惠5–8响应率很高,这些也都碰巧是通过社交渠道(以及网络、电子邮件、移动设备)提供的优惠。 可以把社交渠道单拎出来验证它是不是会对反应率造成影响。 优惠7的整体响应率特别高,而且它就是一个优惠的通知信息。 但是和同类的优惠2相比,响应率存在明显差异——这进一步强调了社交渠道的有效性。 难度最高(10天之内最低消费为20美元)且奖励最高(5美元折扣)的优惠4的整体响应率最低,这很可能是由于只通过网络和移动设备发送的关系。
女性细分受众群(2、5、8、11)的平均响应率比男性细分受众群的更高,尤其是那些通过移动设备和社交渠道传播的优惠。 细分1(千禧一代,男性)的响应率特别低(40%左右,而其他大多数都> 50%)。 其他性别的细分(3、6、9、12)的响应率分布情况大为不同,这很可能与样本量极低有关。
优惠4(5 美元折扣、10 天内花 20 美元)对大多数细分市场最为有效。 一般来说,优惠 0、1 和 9效果也很好,紧随优惠4之后。 前十种优惠的优惠类型不是“折扣”就是“买一送一”,几乎均等。
收入与支出金额为正相关关系,与直觉相符。
“沉默的一代”细分市场预期收益最高,其次是“婴儿潮”和“千禧一代”。 (“沉默的一代”:二十世纪二十年代中期至四十年代早期出生的人, “婴儿潮”:1946-1964年出生的人,“千禧一代”:八十年代早期至九十年代中期出生的人)
验证购买率和传播渠道之间的关系。 具体来说,如果通过社交渠道提供优惠4(最高回报,最低购买率)会发生什么? 对于每个细分市场,要发送的优惠的最佳组合是什么? 探究“意外购买”(没查看优惠,但依然购买)的价值——它是否会导致未来的支出行为发生变化吗? 进行类别分析(例如K-Means聚类)来验证、确认识别出的细分市场。 有什么方法可以提高男性的购买率(因为他们的预期支出很高)? 用更大的样本数据对其他性别(3、6、9、12)进行细分。
延伸阅读👇
干货直达👇
评论