用户留存分析的关键因素
确定流失和留存的具体口径;
通过定性和定量等方法寻找与用户留存相关的指标,并设计相应策略;
设计AB实验,检验留存提升策略的有效性。
01
关键行为
02
窗口期
1
搭建影响用户留存的指标体系
流失用户:调研其年龄、性别、职业、城市、圈层等社会学画像;
深度挖掘其为什么流失的原因;
回归意愿如何;
以及流失的去向是哪里;
他们对竞品和本品的使用体验差异点在哪里。
留存用户:社会学画像;
留在本品的核心驱动力;
通过什么方式被吸引到本品;
来源渠道。
2
影响留存的重要指标筛选
01
相关性分析
01
基于各类树模型
用户画像类特征(年龄、性别、城市、手机品牌、手机型号、平台角色、是否安装竞品、竞品APP安装数量、新增渠道类型);
活跃类标签(近 7 天APP启动次数、近 7 天APP使用时长、近 7 天活跃天数、首次活跃距今天数、末次活跃距今天数);
消费类行为标签(近 7 天内容曝光次数、近 7 天内容点击次数、近 7 天内容播放时长);
互动类行为标签(近 7 天点赞次数、关注次数、评论次数、转发次数、收藏次数);
付费类行为标签(近 7 天打赏主播次数、打赏金额、充值金额);
金币激励类标签(近 7 天金币提现金额、签到次数、得金币数、访问福利中心页面次数)。
正样本:
留存用户,即前7-14日(2021.07.01-2021.07.07)启动过APP,近7日(2021.07.08~2021.07.14)启动过APP的用户;
负样本:
留存用户,即前7-14日(2021.07.01-2021.07.07)启动过APP,但近7日(2021.07.08~2021.07.14)未启动过APP的用户。
正负样本的样本数尽量保持在1:
1,避免正样本数量过少导致学习不到正样本的信息,或者负样本数量过大影响训练速度;
模型预测效果不佳时,可以尝试使用多种模型,比如GBDT+LR、XBoost等;
区分不同类型用户分别构建模型,比如区分新老用户、创作者用户和消费型用户、高低中频次用户等。
3
留存关键因素的因果性验证
总结
推荐阅读
欢迎长按扫码关注「数据管道」