数据指标 ,啥叫DAU?
定义“活跃”
用户发出什么样的行为并达到怎样的行为强度才算活跃?
定义关键行为,关键行为和用户需求或者产品核心价值有关
e.g. 阅读类的app,那么就应该将活跃对应的行为定义为“阅读”,而不是“打开app”;
e.g. 思考:访问“微信读书”小程序,只做“每日一答”,没有“阅读”行为,这样能算入活跃中么?行为强度阈值,阈值可以通过行为的时长、频次等强度指标来限定,具体的判定要结合实际业务场景或者数据分布情况;
e.g. 反例:打开app还没停留3秒就退出了,很可能是用户误操作;
e.g. 对于阅读类app,阅读至少一篇文章或书籍并超过一定的时长,这个时候才能算用户真的是在“阅读”,基于这样的业务阈值下统计得到的活跃用户数才是和“阅读”这个核心产品价值挂钩的;
e.g. 思考:类似抖音或者快手的视频流,用户刷到某个视频时播放了短短几秒就退出,这个视频要不要计入“观看视频数”的统计中?
剔除异常用户
前面在定义“活跃”中主要关注了“有意义的业务行为”,也可以理解为是在“行为”上的限定,而我们要统计的是“活跃·用户·数”,除了那么是不是所有符合行为筛选规则的“用户”都应该纳入到这个指标的计算呢?
或者这样思考,用户数的计算一般是count distinct(user_id)
这样的逻辑去计算,那么什么样的user_id
是需要排除的?——这里之所以用user_id
而不是“用户”,是因为“用户”这个概念可能会让我们倾向于认为这些有访问记录的ID背后都是“正常的人类”。
除了在“行为”上进行限定外,对“用户”的限定还包括:正常
&人类
。
僵尸号、爬虫、机器流量等,不能算“人类”; 即使是人为操作,如果是出于“非正常的目的”,比如刷量、刷评论,那这种也是要剔除的;
活跃的时间周期
结合到上述两点,对“活跃用户数”的业务口径可以定义如下:
在一定业务周期内 发出了某关键行为且达到行为门槛 对应的正常用户的数量
这里还有一个小问题——活跃对应的时间周期。
大多数to C的产品都是为了解决用户需求,用户需求有高频、低频、一次性之分,所以对应观测周期就会有差异。
高频需求,可以理解为一个人几乎每天都可以发生的行为,e.g. 吃饭、睡觉、阅读信息(刷文章、看视频)等; 低频需求,需求间隔时间比较长,可能会间隔数月,e.g. 旅行、长途交通、租房、求职、购买节日礼物或手机等贵重物品; 一次性需求,e.g. 升学考试、买房装修、结婚相关等;
活跃对应的时间周期的一般划分方法是要保证在这个周期内大多数用户都会有至少一次目标行为发生,如下图示。
不过,这个时间周期也不一定是固定的,可能因为产品结构的改变或者运营策略,导致周期缩短。
活跃成分拆解
以下列举可以拆分的一些维度:
基于用户属性,e.g. 新/老客、会员等级、是否付费等; 基于用户行为 行为的强度,e.g. 访问时长、频次等; 行为指向物,e.g. 浏览的商品类别、访问的栏目等; 基于时间周期,e.g.对当前周期活跃的用户数拆解(如下图示)
当前业务周期的活跃用户数
,包含以下4个成分:
本期新增用户数量
上期新增用户且在本期活跃的用户数
上期活跃老客且在本期活跃的用户数
上期沉默老客且在本期活跃的用户数
报表开发(指标篇),3.2 自上而下的方法
从活跃成分看业务
前面提到了,当前业务周期的活跃用户数
可以拆分成4个成分。
e.g.
本期新增用户数量
,如果每期新增用户量比较少,可能是业务处于成熟期或者探索期,可以理解为此时业务增长乏力(可能是市场已经饱和或者说渗透率打顶),或者还没有开始增长;e.g. 结合新老客的占比在时间上的变化趋势也可以判断;
e.g.
上期新增用户且在本期活跃的用户数
,这个数值除以上期新增用户数
就是留存率,所以这个指标也能揭示产品留存的好坏;e.g.
上期活跃老客且在本期活跃的用户数
可以看活跃渗透率(用户黏性),比如微信这种高活跃高黏性的app,比如昨天和今天的活跃用户都是10亿,实际上两天的用户重合度是很高的,也就意味着用户的黏性很强,定位到这群“高粘性用户”后,可以分析这些用户的属性和行为特征,可以作为拉新渠道筛选的依据,也可以定位可能导致这些用户高粘性的产品功能或者运营活动;e.g. “上期活跃本期沉默”的用户可能暗含了产品问题,沉默的用户可能是“流失”,也可能是行为比较“稀疏”;
e.g. 用户流失挽回,实际上就是唤醒
上期沉默
或者上上期沉默
的用户进入“活跃”状态;e.g. 通过对比不同周期的新增用户数,对比渠道的质量或者拉新策略的效果;