如何理解业务指标
指标的计算口径
也就是指标是怎么算出来的?
用代码写是怎样的(技术口径) 用业务描述是怎样的(业务口径)
e.g. 设商品信息有cat_id(品类编号)、sku_id(商品编号)
指标名称 | 代码 | 文字描述 |
---|---|---|
商品宽度 | count(distint sku_id) | SKU数量 |
商品广度 | count(distint cat_id) | 商品品类数量 |
一般来说,上面的表格会被整理为指标字典,一般需要登记的字段包括:
指标中文名称:需要和业务保持统一口径;
指标英文名称:主要是在中间表或者代码中统一;
业务口径:文字描述指标的统计逻辑,哪些情况的数据要算进来,要排除的情形是哪些;
技术口径:包括指标计算引用的源表、字段、计算规则,通常要附上SQL代码;
业务说明:这个指标一般是什么业务人员关注、指标高低的一般解释等;
其他备注:比如指标计算可能出现的坑;
除此之外,还要注意:
限定条件
,相当于用SQL指标计算代码中的where字句
,一般有空间和时间两种限定条件,e.g. 活跃用户数,要限定用户行为类型及阈值(比如访问时长)以及统计的时间周期(包括选择的时间字段和时间颗粒度等,比如首次or最后访问时间);隐含前提
,e.g. 退货率,区分上月订单的退货率
,以及,因为可能有上个月订单,下个月退货的情况,所以集合A不是完全包含于B的,在转化率
关系上不是匹配的,此外,对于“转化率”类的指标,都有类似的逻辑。
指标的关联因素
指标的关联因素主要考虑:
哪些因素会影响该指标?该指标发生波动可能是哪些因素造成的?
指标和另外的哪些指标会共变?当前指标的变化会引起其他哪些指标变化?
指标的影响因素
对“影响因素”的认识,常见的场景就是波动或者差异归因。
e.g. 某app最近几天日活跃用户数(DAU)有下降,如何排查原因?
e.g. 最近客单价下降,可能原因有哪些?
对指标背后的影响因素的理解可以考虑如下几方面:
哪些因素会影响该指标,或者哪些业务活动会影响指标的变化; e.g. 2015年统计的平均身高,2020年统计的平均身高,人群成分(e.g.年龄结构) 什么情况下该指标会上升? e.g. 业务处于快速成长中,新客占比高 什么情况下该指标会下降? e.g. 什么情况下会拉低支付成功率? 哪些影响因素在业务情景下是可控的(通常是业务活动),反之,哪些不可控(外部因素)?
其他共变的指标
常见的情况有两种:
AB两个指标都受到同一业务操作或其他因素影响,e.g.某个页面有问题无法跳转支付,那么转化率和投诉量可能都会变化; A指标可能是B指标的组成部分,比如是其中的分母分子或者细分成分;e.g. 新客DAU大幅增加,新客的客单价低、付费转化率低,那么可能把整体的客单价和付费转化率都拉低(参考 糖水不等式
的逻辑)。
指标的业务含义
理解指标背后的业务含义,可以从如下几方面入手:
指标所描述的对象或场景
,e.g.同样是付费,为什么有的业务看重付费率、有的则看重客单价?指标在业务场景下的特点
:有没有周期性变化?e.g.PC端流量在周末会大幅下降; 在不同 业务生命周期
下指标会如何变化?e.g.处于更新状态和完结状态下的某在线课程页面访问的DAU;在不同 用户生命周期
下指标会如何变化?e.g.新客和老客的转化率、使用时长、回访周期等指标;同样的指标,在不同业务场景下的表现如何,比在游戏、内容平台(e.g.知乎、快手)、课程平台上——使用时长、时间段、每个月活跃天数等都会有差异,这种差异既和业务形态相关,也和用户的需求特点有关。 判断业务好坏对应的指标参照基线
,这个基线除了用于判断业务表现外,还可以看业务的成长空间。常见的参考值:行业参考值(TOP值、均值) 竞品或者成熟的业务线 不同细分业务组、整体表现值(表现优异还是“拖后退”) 上一时间周期(是否在“增长”) 数值的高低说明什么问题?
e.g. 商品深度大,表示商品库存充足不易缺货,反之也可能潜藏高库存的风险; e.g. 留存率,既体现了用户的黏度,也体现了产品对用户需求的匹配程度; 数值的变化会是什么原因?
同样的变化在不同业务场景下又不一样,好比同样是头疼发热,但是背后的原因是不一样的。e.g. 客单价降低,如果是因为扩充了低单价品类商品或者新用户比例增加引起的,那就不用太紧张,但如果是因为缺货、老客客单价下降等,那可能就有比较大的问题; 指标的变化也可能是数据变化引起的,比如统计统计有限定订单状态,而订单状态会发生变化;
推荐阅读
欢迎长按扫码关注「数据管道」
评论