数据分析需要的产品思维:关于唯一性的思考
德国哲学家布莱尼次曾说:世上没有两片完全相同的树叶。这说明即便是外在形态非常相似的一类事物也是不同的个体,通过某种条件能够将它们不同之处表现出来,进而进行区分。
就像两个双胞胎,即便长得非常相似难以区别,但是他们是2个不同的个体,我们可以根据他们出生的时间辨别他们;家人为他们起名字去区分他们;警察根据他们的身份证号去锁定他们的各自身份;他们各自的朋友会通过拨打不同的手机号码分别找到他们。
在辨别事物之间的差异时,我们要找到事物之间存在差异的表现形式。当设计产品时,我们需要设计让事物具备唯一性条件的能力,目的是通过“差异”帮助我们定位来源对象是哪一个。
对象是唯一的
对于一款产品,我们设计完它的前后端页面展示后,技术还需要考虑这款产品中涉及的字段中, 段表结构的设计。目的是为了将字段内容数据存储到表中,不同的字段内容通过表分隔开来,数据中每一条记录都能够独立、唯一。
而产品经理想要的对象唯一是对象在某种标准条件的界定下是独一无二的,在某种形式上的表现是不重复的,也就是说用标准条件,将数据中的记录能够分类合并。
打颗栗子:
平台中的用户就是需要用标准的条件将“用户”这个字段的值界定唯一的。
当我们有用户的身份证号时,我们优先会使用用户的身份证号作为区分用户的标准条件。不同身份证号的用户区分开来,同一身份证号下的用户产生的数据会合并到该用户的表中进行储存。
如果用户唯一性界定条件为用户的设备ID时,我们并不能确定使用设备的人是谁。可能最开始使用这个手机的人是张三丰,登录了微信。但是后来这个手机在闲鱼上被卖掉了,买家王二麻购买了这个手机,登录了微信。如果使用用户设备的ID,我们是无法保证设备背后的用户是不变的。同理, 使用IP地址也无法保证IP地址背后的用户是不变的。
我们可以发现,产品经理设计的对象唯一性标准条件,是需要产品经理在深入调研并理解“对象”的背景下,再设计条件,满足准确区分对象的目标。
对象唯一的标准条件出现问题,不仅会对对象产生数据的存储位置有影响,而且会对数据统计产生影响,因为无法统计出真实的数据。公司财报体现的用户的总量、增量、活跃量等等的数据,也不再具有意义。
试想一下,一个平台的2名用户都叫张三丰,但是他们的性别不同,如果产品经理没有仔细思考,将唯一性标准条件设计为用“昵称”进行区别,这两名用户就不会区分开来,他们就会合并到一块,而真实的情况是有2名用户登录了产品平台,但我们最后只会统成1个人的数据。
所以我们会发现,在网络平台中,很多的产品,用户第一次登陆时需要用户注册账号,比如微信。我们也会发现,像资讯类产品、购物类产品支持用户先浏览,当进入到特定的功能或环节时,才会需要用户登陆,如果用户没有注册,需要注册后再进行使用,比如淘宝、抖音、今日头条等等。
产品经理为用户设计唯一性条件,将用户进行区别的价值是,将线上的数据与线下真实的人进行关联,组成用户。用户的行为数据进行统计归纳,整理出来的用户画像和用户活跃量对公司的下一步动作,提供了参考方向。
唯一性的作用
刚才我们了解了唯一性对于公司来说是非常重要的,下面我们继续深入思考一下,唯一性的作用。
1、唯一性条件可以让字段的值具有不重复的能力。产品经理在设计了唯一字段以后,会继续设计 该字段中唯一字段值的查重规则。
查重规则:是指通过比较字段的值,来确定添加或者导入的数据与现有系统中的数据是否重 复的校验规则。当想要保存的字段值是重复数据时,页面会显示“数据重复无法保存”的提示 信息。重复值需要被过滤,或在数据清洗中进行删除。
设计查重规则的条件后,在以下4种情况下会被触发,识别字段值是否重复:
1)新建数据时
2)详情页扣框编辑时
3)前台导入数据时
4)API创建数据时
打颗栗子:
我们注册一家公司第一步是要为这家公司起名,我们会登录工商局网站进行申请。在工商局起名页面将名称填入后,点击公司名称右侧的“检查”按钮,检查公司名称是否重复。
由于《企业名称登记管理实施办法》规定公司名称是不允许重复的。工商局平台将用户输入的公司名称进行精确校验,来确定名称是否唯一。当用户录入的企业名称重复时,检查结果会提示“名称重 复”,并显示与用户起名重复的企业名称。
2、通过唯一值能够精准查找到对象,查询到的结果是唯一的。
打颗栗子:
我们齐齐哈尔的牛肉非常好吃,一般在冬天我会将齐齐哈尔牛肉和蘸料邮寄给我的亲朋好友,让他们在家就可以烤肉,品尝到齐齐哈尔BBQ。前段时间我给朋友定了烤肉,因为发的是顺丰快递,过 去了3天我看朋友那边没有回复,就担心肉没有邮寄到,我就打开了顺丰快递小程序,点开查快递 页面,输入商家给我反馈的发货快递单号后,点击查找,进入的就是这笔订单的详情页面。
通过快递单号这样的唯一值,查询到的快递详情内容,就是唯一结果。
这里也可以看到一个用户路径的设计逻辑,当使用唯一值进行查询时,页面无需进入到列表页,直接进入详情页即可,因为列表页中显示的结果会是唯一的。直接进入详情页可以让用户少走一步用户路径。像天眼查,当查询的是公司名称时,直接跳转的就是公司详情页,因为公司名称是唯一值。
唯一性校验规则
数据的唯一性在主数据系统中是非常具有价值的,因为主数据中已审核的数据记录都是客观、标准且唯一的数据。所以唯一性校验规则的设计是必不可少的。
唯一性校验规则和校验范围是用来校验数据的值是否唯一的一种规则设计,这种规则保证了数据的值不重复。
1、校验规则一般有2种:
1)单值唯一校验规则:即当前字段下的值不允许重复。就像药品的通用名称,是唯一的,不允许重复的。
2)组合值唯一校验规则:将字段A、B、C等等字段组合在一块,进行唯一性校验。根据不同的条件,组合字段中至少1个字段的值在这个条件下是不重复的。
我们来打颗栗子:
我们平常去药店购药可以看到药盒上有“药品通用名“、”药品商品名”、“剂型”、“规格”这么几个信 息。药店的药品特别多,不同药厂生产的不同剂型和规格的药品是需要单独在系统中进行管理的。那么药品是如何管理使得它在系统中是不重复的呢?
下面我们先来了解一些药品的基本概念。
药品的通用名:
是指中国药品通用名称,由药典委员会按照《药品通用名称命名原则》组织制定并报卫生部备案的药品的法定名称,是同一种成分或相同配方组成的药品在中国境内的通用名称,具有强制性和约束性。
按照国家出台的规定:药品包装上的通用名必须显著标示;单字面积必须大于商品名的两倍;在横版标签上,通用名必须在上三分之一范围内的显著位置标出(竖版为右三分之一范围内);字体颜色应当使用黑色或白色。所以,黑色或白色,字体较大的,在包装盒的上 或右侧,而且名称较复杂的就是通用名。
药品的商品名:
是指经国家药品监督管理部门批准的特定企业使用的该药品专用的商品名称。简单来说是由不同的药品生产厂商对自己制剂产品所起的名字,经过注册,具有专用权。
所以同一种药物由不同药厂生产的制剂产品往往具有不同的商品名,但同一个通用名可以有多个商品名(因为生产厂家是不同的)。当商品名唯一时,理论上一个商品名只能对应一个通用名,由于剂型、规格可以不同,一个商品名会对应多个剂型和多个规格,不同的规格或剂型下,相同商品名的药品是需要分开来管理的。
所以药店的药品管理中,唯一值校验重复的规则,是将药品通用名、药品商品名、剂型和规格这4个字段组合在一起进行校验的。
如下图的药品列表,通用名均为维生素E胶囊,但商品名其实是各不相同的,通过列表页展示出维生素E胶囊药品的结果。
有些通用名、商品名、剂型都相同的药品,规格是不同的,列表页也是将不同规格的药品分开来展示的。
2、校验范围:
1)全局唯一性校验:指在全部表中进行值的唯一性校验。
打颗栗子:
主数据中数据包含已审核数据和待审核数据,参与校验的数据并不仅仅是已审核的数据,而是已审核和待审核的全集数据进行唯一性校验的。
2)单表唯一性校验:是指仅在这一张表中进行值的唯一性校验。比如还是主数据,仅在已审核数据表中进行校验,不在待审核中进行校验。
唯一性能够有效保证数据的唯一,后期会尽可能避免数据的清洗和删除重复数据的人工劳动力。
总结
产品经理在设计唯一性规则时,需要能够深入理解业务。对象的唯一性进行设计需要保证字段值之间是能够互斥唯一的。评审前我们要记得将唯一性规则在PRD中优先思考好,写出来,逻辑通顺完 整做到有理有据,避免二评哦~
推荐阅读
欢迎长按扫码关注「数据管道」