全文共6982个字,建议阅读13分钟
来源:数据科学家联盟
几乎所有的数据分析工作都会提到一个词——“建立数据指标体系”,虽然这个词对于大家来说并不陌生,但是数据指标到底是什么以及如何具体的搭建,很多人还是一头雾水的。
在了解什么是数据指标之前,我们思考一下:为什么会出现指标?它是为了解决什么问题?人类及科学的发展是与时俱进的,早期为了使自然科学的实验及结果更具统一性及方便标准化衡量,一些标准化的专业指标应运而生。随着人类社会的发展,社会科学也越来越需要统计学来进行事物的衡量,一系列统计学指标也逐步产生了。随着新信息技术的发展,数据指标逐步被大众认可为衡量目标的方法。从社会科学角度看,指标是统计学的范畴,用于数据的描述性统计。指标是说明总体数量特征的概念及其数值的综合,故又称为综合指标。在实际的统计工作和统计理论研究中,往往直接将说明总体数量特征的概念称为指标。传统的指标有国内生产总值(Gross Domestic Product,GDP)、国民生产总值(Gross National Product,GNP)、居民消费价格指数(Consumer Price Index,CPI)、沪深300指数等。
1、什么是数据指标?
数据指标有别于传统意义上的统计指标,它是通过对数据进行分析得到的一个汇总结果,是将业务单元精分和量化后的度量值,使得业务目标可描述、可度量、可拆解。数据指标需要对业务需求进行进一步抽象,通过埋点进行数据采集,设计一套计算规则,并通过BI和数据可视化呈现,最终能够解释用户行为变化及业务变化。常用的数据指标有PV、UV等。本文所述的指标是衡量目标的方法,指标由维度、汇总方式和量度组成,如下图所示。
其中,维度是指从哪些角度衡量,是看待事物的视角与方向,决定了根据不同角度去衡量指标。汇总方式是指用哪些方法衡量,是统计汇总数据的方式。而量度主要是明确事物的具体目标是什么,是对一个物理量的测定,也用来明确数据的计量单位。比如,播放总时长是指用户在一段时间内播放音频的时长总和(单位:分钟)。按照上述拆解,维度是指筛选的一段时间,汇总方式为计算了时间长度的总和,而量度就是统一的单位—分钟数。这里,我们可以理解为指标是由这几个方面构成,相当于英文的构词法,前缀、后缀等共同形成了一个单词。
2、什么是指标体系?
体系化的本质是将数据指标系统性地组织起来,具体会按照业务模型、按标准对指标不同的属性分类及分层。当然,不同的业务阶段、不同业务类型会有不同阶段的划分标准。数据指标体系含有十分丰富的统计量,从宏观上看,它是一个相对全面的有机整体;从微观上看,每个数据指标都有其特定含义,反映了某一细节的客观事实。不同的数据指标定义不同,逻辑也不同,这些各种各样的统计量共同构成了数据指标体系,使其产生不可磨灭的价值。总的来说,数据指标体系是对业务指标体系化的汇总,用来明确指标的口径、维度、指标取数逻辑等信息,并能快速获取到指标的相关信息。
1、搭建指标体系要有重点
不能只是罗列指标,这是很多数据分析师都会犯的通病,上来先把大量的指标列好,也不说明优先级,先看哪个后看哪个,业务根本就看不懂。
2、搭建指标体系要有目标
很多人习惯了列指标,自有一套指标拆分的套路,不管我们要解决的业务问题是什么,反正就是按照时间、渠道、区域等纬度拆分,分来分去也没个具体的标准,最后还要纠结到底指标变化多少才是问题。
3、指标体系不是越全越好,和业务最贴切的才是最好的
这个之前的指标体系文章里反复强调了,写文章的时候会为了吸引眼球,标题写XXX行业指标体系大全,虽然给大家整理指标体系的时候尽量概括多个业务场景,指标列的很详细,但是不同的公司,业务复杂不一样,没有一套指标系统是能够通用的,只有和业务最贴切的才是最好用的。
指标体系的搭建分为两大步骤:设计指标体系和落地指标体系,这两大部分又可以拆成一些小步骤,我们先来看一张指标体系从设计到落地的整体步骤图,下面再根据这张图细分拆解其中的每个步骤是怎样落地的。主要需求来源随着产品生命周期而改变。搭建数据指标根据数据现状分为初中后三个阶段。首先要明确的是先有目标方案后再有数据指标,而不是凭空捏造出一些指标体系然后往产品上套。在数据指标搭建初期以产品战略目标为主,优先搭建北极星指标的全方位指标监控;中期以业务驱动为主,搭建指标衡量现有业务,业务驱动直接获取到的指标一般是二级指标,需要整合到指标模型里面去;到了后期,此时各数据指标已经搭建的差不多了,是时候根据模型查缺补漏,搭建针对产品的指标闭环,通过数据来反向推动产品的迭代优化。一级指标其实就是反映产品在各个重要方面的运营情况怎么样,把对用户的运营当成一个流水线,围绕着用户生命周期即可挖掘到一些重要的一级指标并自然而然的形成闭环。在众多指标模型中AARRR模型能很好的概括用户的生命周期,美中不足的是遗漏了用户流失这一环节,个人觉得AARRRR比较能完整概括用户生命周期,即Acquisition(获取)、Activation(激活)、Retention(留存)、Revenue(收入)、Referral(自传播)、Recall(召回)。围绕这六大方面,可以拓展以下一级指标(只是举例一些通用指标,具体的一级指标可根据具体业务进行定义):二级指标由一级指标衍生而来,为了实现一级指标,企业会采取一些策略,二级指标通常与这些策略有所关联。可以简单理解为一级指标的实现方式,用于替换定位一级指标的问题。二级指标的作用就是将一级指标的涨跌落实到具体的业务部门或者是责任人,通过成分拆解我们可以从一级指标得到对应的二级指标。例如收入这个一级指标,通过成分拆解可以分为广告收入和内购收入等。通过二级指标的分析可以找到相应问题的责任方,而三级指标的作用正是指导该责任方去定位具体问题,进而修复问题。通过对二级指标的路径拆解即可得到三级指标,一线人员可通过三级指标的具体表现快速做出相应的动作,所以三级指标的要求是尽可能覆盖每一个关键路径上的关键动作。这里继续拿内购收入这个指标举例,通过路径拆解,最终促成内购的关键行为路径是:浏览商品、加入购物车、提交订单、支付成功。按照以上流程不断查缺补漏确定各一级指标并对其进行逐步拆解,即可搭建出一套行之有效的数据指标体系。终于到了开干时候,有了目标之后接下来就是将规划的指标进行埋点落地了。落地指标就不像设计指标那样首先着眼于一级指标,而是应该首先着眼于二级指标,因为一级指标是由二级指标组成的,二级指标埋点好了之后一级指标自然而然地可以计算出来。埋点不是一个人的事情,需要各部门通力合作,下图就是埋点的整个设计到落地的流程:不知看完这张图有没有一个疑惑,责任方为什么还要去理解熟悉需求,需求方不是给出指标了吗,照着去埋点就好了啊。如果你这么想的话,那你注定只能做一个工具人。首先各指标跟具体的业务逻辑设计紧密相关的,如果你不去熟悉业务,是无法针对指标进行多维度细化埋点设计的,最终设计出来的埋点方案必定是丢三落四漏洞百出。再者需求方给出的指标不一定是全面的,需求方往往数据意识不强,无法洞察到当前业务的很多细节是数据可分析的。所以这就需要数据产品经理熟悉业务懂产品懂用户,才能一针见血设计出一套有指导性意义的埋点方案,而不是照本画葫芦搞出一些冷冰冰的数据看看就好,要记住,每一个埋点都是有深意的,数据也是有灵魂的。明确了埋点的工作流程,接下来要确定的是选择自研数据门户还是使用第三方工具,如:神策、Growing IO、诸葛IO等。这两者主要有以下区别:
- 自研工作量大,搭建周期长,第三方提供现成的模型,搭建周期短。
- 自研更灵活,相对埋点实施方上报数据更友好,无需过多无谓的逻辑记录,在后期的指标计算方式上可以随心所欲,如某些耗时只要打好点,自研就可以通过两个事件的时间差计算出耗时,而有些第三方则不支持。
总之,自研前期痛苦后期爽,第三方前期爽后期痛苦。从实现难度上来说自研需要的人力物力远远大于第三方服务,绝大部分中小公司会选择第三方服务,正如前面所说,指标体系的搭建需要各部门通力合作,一份埋点规范文档既能规范工作流程提高效率,又能明确需求规范减少沟通成本避免理解出现偏差。埋点规范文档包括了工作流程规范、命名规范、需求文档规范等,这些应该在指标体系落地之初就规定好。当然由于一开始经验不足并且有的问题在后续的工作中才会暴露出来,初版的规范文档可能并没有那么详细,但是大体框架还是要有的,后续再补充一些细枝末节的东西。拿到需求原型后,首先将原型里面的页面及页面中的元素名称提前定义好,以便后续进行统一使用避免不同指标出现页面命名不一致的情况。如果是页面的话建议全部命名,页面里面的元素可能会有点多,可以挑一些关键路径上的重要元素进行命名,其它元素视后续工作需求再进行埋点(当然了有精力的话全部命名进行监控是更好的,毕竟数据是多多益善,避免后续需要用数据发现没有埋点的情况发生)。为什么要规范事件名称?我直接举个例子吧,某天你想查看用户的使用路径,当你使用用户路径分析之后发现有大量的展示事件穿插在用户行为事件中,这时候你是不是很恼火。如果之前埋点的时候对事件进行规范命名,这时候你只需要在筛选条件中过滤掉事件名前缀为展示的事件,就可以轻松过滤掉所有跟用户行为无关的事件。事件规范命名除了以上好处,还有个好处就是方便需求方使用,使用者可以通过事件名轻松知道这个事件具体的含义,提高了使用效率,事件命名可由以下几部分组成:行为、对象、结果、类型。
点击 – 点击某个按钮或元素的一类事件。
进入 – 进入某个页面或功能的一类事件。
展示 – 展示某个页面或元素的一类事件。
退出 – 退出某个页面或功能的一类事件。
事件行为必须填写,后续可按实际情况增加其他行为。
对象:事件行为对应的具体对象可以是页面,或者是功能,事件对象必须填写。
类型:此参数为拓展参数,如展示事件可能展示的是页面,也可能展示的是弹窗,这时候在事件后面加个页面后缀或者弹窗后缀,后续使用起来就能很方便的区分事件的具体类型。事件类型为可选参数,视情况而定。以上就是事件的命名标准,可以从该标准进行如下一些命名:注册_指标_成功、进入_充值页面_成功等。这时候就要隆重介绍一下前面《指标体系搭建流程图》中提到的新4W1H分析法了。为什么叫新4W1H,因为针对传统的4W1H进行了新的的解释,在新的释义上可以更加合理的加上本人在实际工作中总结的经验。根据平时的埋点总结,事件维度主要由主题和事件因果几个大维度组成。主体即用户、设备和应用,因果即这个事件的来源和结果。通过增加因果维度可以方便的看到一个事件的来源和去向。我们先用一张图来了解下新4W1H分析法是如何定义维度的:Who:触发该事件的主体,是唯一区分用户的标志,如果用户登录了则使用用户ID(设备ID也需要记录),未登录则使用设备ID。When:事件发生的时间,使用UNIX时间戳就好。What:描述触发这个事件的参与主体具体信息,一般有三个主体,用户本身、应用、还有设备。使用第三方服务的话除了用户信息需要我们埋点设置,其他的第三方SDK都会自动采集,所以这部分参数不是我们工作的重点。Where:事件发生的物理地点,可以用过GPS、LBS、IP来判断,具体视用户的授权而定。位置信息第三方SDK也会自动采集。How:事件的具体描述,这一块才是我们工作的重点,缺乏经验的话往往会遗漏一些重要的维度,导致后续的分析支持不上。根据个人总结的因果分析法可以将事件的描述分为来源和结果描述,事件的来源去向无非有两类:多个行为造成同一个结果、一个行为造成不同结果。例如:进入充值页面,可能从不同入口进来的;点击充值按钮,可能会充值成功或者充值失败。事件的结果即为对该事件的具体信息描述。通过因果分析法进入充值页面到充值成功这一系列行为我们可以做以下事件埋点(以下事件维度只列举因果分析法相关维度,其它参数视具体业务自由增加)。通过这样的埋点,我们就可以很清晰的知道进入充值页面各个入口的分布情况,也能知道点击充值按钮后充值成功和失败的分布。事件的上报时机由事件的定义来具体决定。主要有以下三大类:
- 展示:展示时候上报,需要明确重复展示是否重复上报,像那种自动轮播的banner就不需要重复展示重复上报,因为这样的重复上报是没什么意义的,而用户反复滑动导致的重复展示可以重复上报;
- 点击:点击时上报,这个是最简单的上报时机,一般没什么争议;
- 接口:这个涉及到与后端的接口交互,如前面举例的购买_金币_结果事件,上报时机则为充值成功或者失败时上报,即客户端拿到后端返回的具体结果时上报。
当上面工作已经做完时,就可以输出需求文档了,需求文档主要包含以下信息:
埋点指标上线后,为了方便业务方使用,可以将各指标按照业务分为不同的主题,方便使用者快速找到需要的指标,具体包含以下信息:
04 数据指标体系搭建方法及经验
那怎么才能搭建有效的指标体系呢,笔者给大家分享以下几点经验:
数据分析离不开业务,了解业务是我们搭建指标体系的前提,掌握一些基本思维模型,可以帮助我们快速、全面的洞察业务。经典的数据分析思维模型。以五个W开头的英语单词和两个H开头的英语单词进行提问,从回答中发现解决问题的线索,即何因(why)、何事(what)、何人(Who)、何时(When)、何地(where)、如何做(How)、何价(How much)。
5w2h能帮助我们培养一种严谨全面的思维模式,让分析的过程更加全面更有条理,不会产生混乱和遗漏,当你觉得你的指标体系已经很完美的时候,可以用这个模型来帮助你肯找到思维的漏洞。
逻辑树方法可以帮我们将复杂的业务问题拆解成多个简单问题,从而帮助我们拆分更细的数据指标。
Mece原则的意思是“相互独立,完全穷尽”,我们搭建指标体系的一个重要标准就是不重复不遗漏,运用mece原则可以很好的帮助我们把握核心指标,提升指标系统的有效性。
商业画布是一种分析企业价值的工具,通过把商业模式中的元素标准化,引导我们的思维,将业务知识素材归档,在了解业务的过程中,我们可以按照下面张图来完善填充,从多个角度全面的洞察业务
除了上面的思维模型,最好的了解业务的方式就是和业务方多交流,认识当前业务的关键问题,毕竟建立完善系统的指标体系需要很长一段时间,最好从部分关键点开始,先解决问题。对应业务场景的指标体系有相应的方法论,比如基于用户生命周期的指标体系AARRR、客户满意度指标体系等等,简单给大家分享几个:这个概念是我在《精益数据分析》中看到的,指的是当前阶段无比重要的第一指标,同时也指出了在创业阶段的任意时间点上应该且只关注一项重要指标。这个概念在我们搭建数据分析指标体系的时候同样有指导意义。先抓住公司当前阶段的“第一关键指标”,然后再把这个指标拆解到各部门,形成各部门的“第一关键指标”,也就是我们说的OKR,或者是KPI,然后再根据各部门的业务,基于这个第一关键指标思考应该关注哪些细化的指标。
总之,关于指标体系的搭建可以先模仿再优化,重点是解决业务问题,我整理的一些特定业务场景的指标体系,可以先模仿套用,再根据业务形态加以调整,快的话,2个小时一个指标体系即可搭建完成。
数据分析什么要搭建指标体系?有什么用?可能大部分人都说不清楚。在笔者看来,搭建指标体系的价值主要有3点:
指标体系可以建立业务量化衡量的标准,数据分析的目的就是说明、衡量、预测业务的发展。比方说衡量一个门店经营的状况,一个门店月净利润20万元,刚看这个指标感觉这个店盈利不少,发展应该不错
但是再一看前两个月的净利润,发现前两个月的净利润都是40万以上,增加了这一个指标,我们就发现了这个店的经营状况可能存在问题了。
在衡量业务经营状况的过程中,单一数据指标衡量很可能片面化,需要通过补充其他的指标来使我们的判断更加准确。因此,搭建系统的指标体系,才能全面衡量业务发展情况,促进业务有序增长。有了指标体系,数据分析师就可以少干点临时提数的活,指标体系建立后应该能覆盖大部分临时数据分析需求,如果指标体系搭建完了,还是有很多临时的分析需求涌现,那证明这个指标体系是有问题的。
建立了系统指标体系,有了过程与结果指标,有了指标的前后关联关系,就可以通过回溯与下钻,快速找到关键指标波动的原因,老板让你分析原因,再也不用愁眉苦脸了。
不过这些价值发挥的前提是建立合理、有效的指标体系,且数据质量有保证,数据质量都不能保证,指标体系搭的再好,分析出来的结果也没什么意义。