如何搭建用户画像系统?以保险行业为例
本文由作者 PM何小泽 发布于社区 大数据技术本质目的是从海量数据中挖掘有价值的信息,也是目前保险科技领域应用度最深的技术。本文主要介绍大数据技术应用落地之一的用户画像系统,以及在保险行业中的搭建思路和具体应用。 01 保险行业痛点
聊大数据在保险行业的具体落地前,先来看看这个行业有哪些痛点,才能理解技术要如何应用。 保险企业方面,对用户不了解、粗放式经营,产品很多是标准化的大礼包组合,导致产品贵、销售时投放不精准、并不一定符合用户需求。保险企业也销售效率低,综合成本高。 用户方面,购买流程体验差,被销售误导后买到不合适自己的产品就感觉被骗了, 理赔困难,对保险信任度低。 虽然保险需求对于用户来说属于低频,但对绝大部分人却是刚需的。目前全球国家的平均保险深度(保费/GDP)达7%,日本9%,美国11%,中国香港19%,中国台湾19%,而整个中国作为目前全球第二大经济体,大陆的保险深度仅有4%,只有世界平均水平一半多,与发达国家相比差之甚远,还有很大的进步空间。 主要原因还是目前整体国民的理财和风险意识还处在普及过程中,不同群体用户对保险的个性化需求还没有得到满足。 一边是行业问题的亟待解决,一边是信息技术的不断进步,组合在一起,保险科技就成了解决行业问题的重要驱动力之一,保险行业也因此进入了一个高速信息化改造的时代。 02 保险科技的主要技术与落地环节
保险作为一种产品,从生产到销售再到使用(理赔),从业务上主要分为以下四个大环节: 产品设计、营销、投核保、理赔服务 而保险科技运用的技术主要分以下五类: 云计算、大数据、人工智能、物联网、区块链 技术与业务环节的组合就会衍生出不同具体的落地项目,具体如下: 来源:2020年中国保险科技行业研究报告-艾瑞咨询 来源:2020保险创新发展研究报告-亿欧 本文主要聚焦大数据技术的具体落地,从上述两份行业报告中可以看出,目前保险科技落地的技术中,大数据是最为成熟应用范围最广的,在保险业务的各个环节均可得到应用。 过去的保险行业,获取用户数据的方式有限,只能通过局部的问卷调查了解用户需求,产品的定价也大多是参照全国平均寿命等较为笼统的数据报告。 而互联网保险由于接触用户的方式得到了极大的提升,对用户的了解也更加深入。 保险科技的大数据应用则是把这些散落在各处的用户相关数据进行整理,对应的进行更精细化的保险产品定价设计,以及与用户实际需求进行更精准的匹配,从而实现了保险企业的降本增效,也为用户提供了真正符合需求的产品。 03 保险行业用户画像系统搭建思路
用户画像系统是大数据落地应用的底层基础系统,要想充分了解用户、对不同需求用户群体产品的差异化设计、营销环节精细化运营,以及个性化推荐等,都要基于画像系统的标签数据。除此之外,对于保险行业独有的业务特点,也需要重点考虑进去。 关于搭建保险行业用户画像系统的思路,我个人整理了以下几个方向: 1、企业数据现状分析
是否需要开始搭建大数据平台,要做到什么程度,取决于当前企业的数据化程度。对于如何评估企业的数据化程度,可以参照数据管理能力成熟度模型DMM,一共分为5个层次,如果到了第二层次,就需要开始着手搭建标准化的数据平台。 不过该模型属于数据界较为通用的的模型,对于我所在的互联网保险企业,我个人从以下几个具体的方向进行了评估。 1)企业是否有足够多的产品和服务? 2)用户的属性层次是否多样复杂? 3)企业用户体量是否到达一定规模? 4)企业是否数据孤岛效应明显,多业务线数据难统一? 5)企业销售效率是否有较大提升空间? 以上问题的答案都为是,因此搭建用户画像这样的大数据基础系统比较符合当前公司发展阶段的需要。 2、保险行业的业务特点
用户画像系统其实是大数据实践较为通用的底层系统,在互联网行业其实已经非常成熟,对于很多电商、视频、社交平台早已经实现,很多实现千人千面的推荐系统也是基于用户画像的标签数据。 但是这并不意味着在互联网保险行业做用户画像系统就只需要生搬硬套。如何与保险行业结合、为企业降本增效、为用户提供更好的服务和产品才是最重要的,因此首先需要分析保险行业的业务特点。 保险行业的业务特点会直接影响用户画像系统的标签定义以及后续的应用。我总结为以下几个特点: 1)低频、大额 相比于日用品、买菜、服装、家用电器等电商,保险和房车类似,属于低频的产品类型,平均单笔金额几千、上万元,对很多用户来说属于大额支出。这决定了保险的销售首先要解决是的首单成交率,而不是复购,也不是用户活跃度。 2)决策流程长 低频大额同时也导致的用户的决策流程较长,比如购买一款重疾险,用户一般都会货比三家,希望选择性价比高且最合适自己的产品,冲动消费的较少。这也决定了很多电商里抓住用户贪便宜、攀比、炫耀的心理,来做游戏化的活动营销的玩法并不适合保险行业。 3)人工依赖程度较高 由于保险产品条款、责任的复杂性,很多用户没有自助理解并完成下单的能力,需要代理人这样的角色介入帮助用户。这决定了个性化推荐功能在保险行业的应用有很大的局限性,因为不管你推荐模型多么科学多么复杂,用户都无法直接信任机器推荐的结果。 4)盈利模式单一 由于保险产品的定价是标准统一的(银保监会报备),不能使用一般的电商价格促销玩法,互联网保险中介平台的盈收绝大部分都来源于保险公司的佣金结算。 3、互联网保险行业用户画像的侧重点
基于以上的保险行业业务特点,在设计用户画像系统时,要考虑如何帮助到业务,可以从以下几个重点方向思考: 1)用户行为数据的量化 保险销售的前提是分析用户真正需要什么,再把对应的产品顺利卖给用户。要想了解用户的保险需求,首先要把用户的行为进行量化,比如产品浏览、活动参与、下单、核保、理赔等行为数据,再通过完善的数据指标体系转化成用户的保险需求。这也是互联网保险相对线下保险的优势,可以不直接与用户对话询问,通过各种数据记录分析总结出用户的需求,用同一套逻辑实现对所有用户的需求分析,不需要人工一对一沟通。 2)提升销售效率 这里的销售效率既包含的用户自助了解产品并完成投保的过程,也包括人工介入辅助用户了解产品并完成投保的过程。 自助投保部分,比如通过用户已有数据能够帮助用户实现快速完成核保,提高下单流程体验。甚至当数据足够丰富时,可以实现自动核保,让用户的保险下单过程像点外卖一样简单快速。 人工销售辅助部分,则是通过用户特征标签,辅助销售人员了解客户的需求特点和保险意向,提高沟通和转化的效率。 3)提升LTV 保险行业里用户的LTV可以理解为这个用户的所有家庭成员的保险需求。 保险需求按照保险类型区分主要有四类:重疾、医疗、寿险、意外。 通过用户画像的数据标签,把用户各个成员的不同保险需求进行量化,分析用户的保障缺口,并通过相关精准活动、营销把合适的产品填补对应的缺口,从而实现提升用户的LTV,同时也提升了整体销售保费。 而一些不太适合互联网保险行业的侧重方向: 为了精准产品推荐而建立复杂的算法模型、提升用户的活跃度、提升复购率、产品价格玩法。 4、标签需求的拆解思路
用户画像的核心是标签系统,只有定义好了标签,后续的应用才会产生好的效果。基于上述对保险行业业务特点的分析设计用户画像的标签时,还需着重注意以下两点:
首先要定义正确的业务目标,然后逐步拆解成可以落地的标签,这样才能避免创建很多对业务并没有太大作用的标签,也避免浪费开发资源。
在定义标签时还要尽量按照MECE原则,让标签之间相互独立,完全穷尽,不要让两个概念有重叠、边界相对模糊的标签产生。
04 用户画像系统构成
下面简单介绍一个完整的用户画像系统主要由哪几部分构成,分别有什么作用。 主要结构如下: 1、底层标签系统
用户画像的核心是用户标签,有了标签数据后才能进行各种条件的用户分析。 而标签系统可以就理解为一个数据仓库,它专门从各业务系统、埋点数据系统、日志数据、外部系统等采集数据,经过ETL数据预处理后,按照标签的定义进行建模计算,得到标准统一且具有应用价值的数据标签。再保持一定的数据同步频率,按照数据服务的多种形式提供给使用方,比如可视化的管理后台,或者API接口的方式。 2、数据服务层
标签管理后台就是标签系统数据服务的主要呈现形式,它主要分为标签管理和用户分群管理。 标签管理的作用是对标签进行可视化管理和操作,主要包括标签的增删查改、上下架,应用方可以方便的查看已有的标签、标签的定义、标签值的数据分布等。 用户分群管理是建立精细化用户分类的数据单元。通过一定方式筛选出一批特定用户,比如通过标签进行自由组合或者直接导入用户,再基于这批用户进行相关的管理、分析和应用。比如设置专属的营销触达、用户标签数据的分析、作为数据方提供给外部调用等等。 3、数据应用层
数据应用层就是具体通过标签或分群去实现具体的业务目标。比如常见的单用户画像分析、用户分群画像分析、进行个性化推荐、精准营销等。 单用户画像数据其实就是一个账号的所有标签的标签值。当一个业务方应用时想知道一个用户的画像情况时,只需返回给他需要的标签值即可。 用户分群画像数据是创建的用户分群的标签数据集合,可以导出标签源数据进行自由分析,也可以按照一定模板,把分群数据制成直观的图标,便于业务方分析。 以上三部分只是简述,由于内容太多,而且行业里已经有很多相关文章从功能层面详细介绍了该系统,此处不再赘述,整个用户画像系统的主要结构已整理成如下脑图。
05 用户画像系统在保险行业的应用
用户画像系统搭建完成后,需要业务方和运营用起来,发现问题并不断迭代,持续帮助业务和运营实现目标,即上节提到的数据应用层。用户画像的应用主要包含下图中的几个方向。 再结合互联网保险行业的业务特性,主要的应用方式可以分为以下几类: 1、精准营销
有了精细化的标签后,便可以基于不同标签组合对用户进行分群,对不同特征组合的用户群进行更精准的内容营销,营销的内容由运营人员自定义,营销的方式可以是短信、微信、邮件、APP内消息、资源位弹窗等,从而提高营销的效果。 这一应用与大多数互联网产品的用户画像应用都类似,核心就是用户标签的自由组合。 2、销售辅助
由于保险产品的复杂性,互联网保险仍然有大量的订单由人工转化用户产生,在代理人或销售顾问跟用户沟通过程中,提前把用户的主要特征和需求通过单用户画像的方式提供给销售顾问,可以更好的帮助销售进行转化。 这样的应用方式同样适用于客服等人工介入流程,核心是提高人工环节用户的体验和促成效率。 3、分群用户画像分析
对于用户分群里这批用户的特征,可以通过分析标签值得到相应的结论,我们常见到的很多报告里对一批用户进行共性特征概括、年龄分布、价格分布等等,都是分群用户画像的数据分析应用。 最简单的做法是支持导出用户分群的标签值数据,然后再做二次加工分析制成图表。复杂的做法是直接在用户画像后台对用户分群通过图标的方式直观呈现数据情况。 4、风控反欺诈和自动核保
保险作为金融产品,有一个重要的业务环节就是反欺诈、反洗钱、反骗保。传统的线下保险,保险公司对用户的资料和数据知之甚少,有很多带病投保的用户,导致保险公司赔付率上升。于是线上销售的保险,保司公司会进行风控核保接口的限制拦截,但是保险公司其实还是缺少用户的数据,拦截率还是不够准确,要么就尺度太严格,多拦截了很多正常的用户。 对于保险中介平台,特别是数据非常多的大型平台,有着无可比拟的数据优势,通过底层的画像系统,把用户的标签进行很好的计算,就能帮助保险公司风控核保,甚至可以根据不同用户的情况自动匹配不同的承保方式(非标体承保时可能需提高价格),既能提高用户快速投保的体验,又能让保险产品实现千人千价销售。 5、辅助产品定制化
传统的保险生产流程是保险公司已经定好了产品形态和价格,再去找到合适的用户进行销售。但是如果可以通过用户画像系统,把标签数据类似的用户聚集起来,反向的找保险公司进行定制,便可以做到更精细化的产品定价和设计,这个思路跟电商里的C2M是一样的。 比如众安保险有一款针对甲状腺结节用户定制的保险《众安百万医疗优甲版》大概就是这个做法。 6、个性化推荐
个性化推荐在很多社交娱乐和电商中非常普遍,实现的就是千人千面,不断根据使用数据优化算法模型,再不断推荐相似的内容。而互联网保险行业里的个性化推荐是通过用户画像的标签数据分析出用户的保险需求,再去与对应的保险类型及产品做匹配,从而实现的较精准的产品推荐。 不过上文也提到,目前用户对保险个性化推荐结果的信赖度很低,而且很多平台可推荐的产品数量不多,实现该功能的人力成本也很高,因此整个行业里应用很少。 06 产品落地过程中踩的坑
对于业务或运营人员,只要知道用户画像的作用和应用方法即可,但对于具体负责该系统的产品经理,必须还要具备各个细节的落地经验,在具体实现过程中,往往会由于很多细节问题导致产品项目的推进缓慢,或者应用效果不佳。 结合我个人从0到1的实践经历,主要总结以下几点值得特别注意,供产品同行参考。 1、标签定义的尺度
1)哪些维度的数据不适合当做标签
不是一个具体的数据,而是一个数据集合。比如产品排行榜、最合适的5个产品。 2)哪些数据不适合当标签储存
经常变化、且数据量较大,可以业务在使用时再二次转化的数据。比如产品名称。 2、数据类型的再拆分,便于具体使用
一般情况下,数据类型只有 字符串、数值、布尔、集合。但在为了具体使用的方便,可以进一步拆分。比如数值数据类型还可以拆分为年龄、一般数值、日期等,这样在进行标签组合应用时,可以更方便的组合运算。 比如出生日期这个标签,在表里一般是以生日时间戳的数值形式储存,如果把一般数值类型转换成“年龄”数据类型储存,在标签使用时可以直接筛选“年龄=10”的用户;如果转化成具体的年月日的“日期”数据类型,标签使用时可以筛选“生日日期>具体某个年月日”的用户。 3、标签类型的定义
标签类型一般分为事实标签、模型标签、预测标签。 系统前期主要是定义事实标签和模型标签,让系统能够跑起来,让业务方用起来。不必为了做预测标签而做预测标签。 因为预测标签需要结合多个用户特征建立较复杂的算法模型,甚至还要对商品也打上标签,根据基于用户的协同过滤算法或基于商品的协同过滤算法,才能实现对用户喜好进行预测。这已经是推荐系统的范畴,而上文也提到,目前互联网保险行业对个性化推荐功能的依赖并不明显。 4、数据准确性的验证
数据上线后,如何进行数据准确性的校验非常关键,否则业务方是无法直接使用的。 数据准确性校验方法大概有几种: 1)标签数据与数据源进行对比
主要检查数据的完整性和准确性。 完整性指数据是否有缺失,比如有的标签数据在数据源中有值,但经过组合计算后,标签值为空。 准确性主要验证与数据源的数值是否一致,如果涉及到有小数点的标签要重点关注取整规则,是四舍五入、进一还是直接舍去。 2)用户覆盖率计算
用户覆盖度是从整体上看这些标签的标签值对用户的覆盖程度,一些个别异常覆盖度的标签要进行单独查验。 比如“性别”这个标签,标签值有 男、女、未知三种,按照正常逻辑,男、女的比例不会差距很大,如果发现男、女标签值比例为1:5,那数据可能计算出错了。 3)业务使用度
随着业务的发展,标签会越来越多。业务方对标签的使用程度也可以从侧面反应标签数据的质量。 如果在系统使用很久之后,发现一些标签从来没有被业务使用过,可以理解为使用度为0,那这个标签要么是定义有问题,不符合业务需求,需要修改定义或删除,要么是数据有异常,业务方不愿意使用,也需要重点检查。 结语
用户画像系统是大数据实践落地的一个基础系统,有了这个基础后,才能进行上层的精细化运营、数字化、智能化经营。保险行业目前仍处于线上化向智能化的过渡过程。不管是保险公司还是保险中介,利用好该系统都能更好的赋能业务、提升效率和用户体验,让保险行业进步到更智能的阶段。
↘好文推荐: 对账系统设计详解(上) 大厂没有方法论(上) 阿里设计师出品!B端产品文案指南 点个“在看”吧
评论