总算是把用户流失分析讲清楚了!
最近做了一些用户流失、生命周期分析相关的项目(电商领域)。些许实战经验,趁周末和大家聊聊。
经常听到有人提起“用户流失”这个概念。
有时候出自老板之口,他可能参与了几场业内交流会,听到“拉一个新用户的成本是维护老用户的10倍”,亦或是对于行业流量见顶的焦虑,深感阻止用户流失刻不容缓。
有时候出自运营之口,他们觉得花了老大劲儿拉来的用户,总得做点什么,不能让用户白白流失掉。不过更多时候,是KPI没完成,想把锅甩给用户流失的大趋势。
有时候出自分析师之口,对用户做了分层/分类之后,发现其中有那么一两类用户即将流失,需要针对性做点什么动作挽回。
我发现,大家虽然聊的都是“用户流失”四个大字,但往往不在一个频道。
究其根源,不同行业,不同岗位,对“什么样的用户行为算流失”这个问题的理解,千差万别。
注:不同行业,对用户的叫法会有些差别,例如电商行业会把购买的消费者叫做客户。本文为了易于理解,统一称为用户。
用户流失的两个关键
我们聊用户流失,首先要搞清楚的是“什么样的用户行为才算是流失”
这个问题,看似很难回答,不过只要抓住两个关键点,就能从容破题。
一是“动作”,二是“时间范围”。
用户什么动作,对我们来说是关键行为?
可能是登录,可能是使用时长,在电商行业更关注的是购买。
有了动作,还需要时间范围来判断流失与否。
通常用“是否超过了某个时间范围”来判断。
如果是电商品牌,一个用户,最近一次购买我们的产品,距离今天已经超过2年了,那他大概率已经流失,再也不会购买我们的产品了。
这两个关键点都很容易确定。动作嘛,大家很容易在内部达成共识;时间范围嘛,则是很容易吵得焦头烂额。
“凭什么你觉得一个用户2年没复购算流失?能不能有点危机意识!我偏要觉得2个月没复购就算流失!”
那,怎么样通过具体的时间范围来定义用户流失状态呢?
简单粗犷地界定
对于没什么数据参考,追求快决策,或者说大家不那么重视数据的公司,拍脑袋决策永不过时。
根据所谓的行业经验,直接拍一个数字。例如超过120天未回购的用户是流失用户,或者拍一个超过1年没回购的用户是流失用户,需要一波唤醒操作。
至于为什么阈值是120天,150天,180天或是1年,答曰经验。
严谨点的会说是行业通用法则或者是参考产品消耗周期,但这么回答的,大概率是没有真正调研过行业具体情况,更没有拉过各种产品消耗周期数据的。
拍脑袋界定用户流失周期的方法,简单,粗暴,结果的可执行程度和拍脑袋人的层级有关。如果是老板拍的,那必然是蕴含了丰富的行业经验,大家也会找一些数据来佐证合理性。如果是实习生拍的,那必然要被拍一顿。
怎么用量化的方式,更科学的界定流失时间范围呢?
如何用数据科学界定流失
先聊聊个体。
因为对产品、品牌无感,或者经历了很差的购物体验,有的用户虽然最后一次购买距今只有15天,但其实已经流失了。
有的用户沉寂150多天,就是为了等下波大促囤货。
还有用户已经1年多未复购过,但是一年半后他又回来复购了。
个体视角,能刻画出非常多有趣、生动的用户购买行为。不过要做分析,还得跳脱出个体,在更宏观的层面把握整体脉络。
量化的核心逻辑,是挖掘出不同时间范围用户,在此后一段时间的回购率分布。
通过用户最近一次交易行为距离某个时间点的远近,以及对应回购的概率,来描绘分布,找到拐点(魔法数字)。
第一步,设定一个时间锚点,界定区间。
比如2021年1月1日。以此时间点为分界锚点,确定流失分析的时间区间和回购分析的时间区间。
区间的界定有一定灵活性,回购分析区间的时间要尽量覆盖锚点前用户的预期复购时间,不能太短,一般会在3个月以上。
假设案例中的品牌消耗周期较长,有大促囤货心智,所以回购分析区间长度是一年。
第二步,在流失区间内分析用户距锚点的时间差。
说起来有点拗口,通过一张图来总结就很形象了。
在流失分析区间内,我们统计出每个用户最后一次的购买时间,并计算最后一次购买时间,和时间锚点的间隔天数(距锚点的时间差)。
例如A用户,他在2021年1月1日之前购买了非常多次,但我们关注的是他最近一次购买时间2020年1月1日,这个日期距离时间锚点2021年1月1日,间隔了366天。B、C和其他用户也是一样的道理。
第三步,判断回购区间内是否回购。
A用户,虽然在流失分析区间的时间范围内,最后一次购买距离时间锚点已经间隔了366天,但是他在回购分析的区间内(2021年1月1日——2021年12月31日)又回来购买了。
这一步是在前面流失分析的基础上,判断每一个用户在回购分析区间内是否复购。
第四步,跳出个体用户视角,分析 距锚点的时间差 和 回购区间是否购买 的分布关系
有了个体用户视角的明细数据,根据距锚点的时间差和回购区间内是否回购这两列数据,很容易透视得到汇总的数据:
用可视化刻画更加清晰:
结果显而易见:不同的时间差区间,回购的概率差异很大。
最近一次购买时间距离锚点30天以内的用户,在锚点之后的时间范围,回购概率高达35%。最后一次购买时间越远,其后回购的可能性也越低。
根据分布图,有两种方法可以帮助我们解决“到底几天才算是流失”的问题。
可接受阈值法:
不同的业务模式、阶段,对用户流失的容忍度是不同的。有的业务模式认为用户回购概率低于15%,就应该算流失,做相关的预警和召回动作。那从图上来看,150天是一个合适的阈值。因为一旦超过150天,用户的回购率就低于15%。
拐点法:
还有一种拐点法。
通过观察曲线拐点,我们发现211-240天之后,用户回购率有一个明显的崎岖(下拐),从11%下跌至不足7%。意味着超过240天,用户回购率有一个明显到肉眼可见的下降幅度,突破了原有的平滑趋势。
可以把240天这个突破点(拐点)作为用户是否流失的阈值。如果用户最近一次购买距今已经超过240天,那他很可能已经流失。
拐点法除了要判断拐点,在用的时候,也要结合不同区间的量级分布。
后话
时间和篇幅有限,今天主要和大家聊了如何界定用户流失这个小话题。方法有通用性和科学性,但还是需要结合实际场景,才能发挥出更大的价值。
用户分析是个很大的命题。界定用户流失只是第一步,接下来的一段时间,会不定期分享我的所做,所感,所悟。