明略科技:数据资产化是如何实现核心数据要素价值的
2020年4月,中共中央国务院发布了《关于构建更加完善的要素市场化配置体制机制的意见》,《意见》首次将数据列为五大生产要素之一,并指出数据要素将发挥对其他要素效率的倍增作用。作为推动经济高质量发展的新动能,国家正鼓励加快培育数据要素市场。
数据价值的重要性被越发凸显,由此,数据资产化迎来了新一轮的发展。
但,数据资产化发展到了怎样的阶段、有着怎样的特点?数据资产化工具的机会在哪里?企业如何发挥数据资产化价值?…
为深入了解和分析这些问题,推动数据资产化市场快速健康发展,中国软件网联合中国软件行业协会应用软件产品云服务分会、海比研究院推出“新增长时代——2021中国数据资产化系列报道”,对行业资深人士进行深度访谈,全面反映他们在数据资产化行业发展中的理解与思考,并在此基础上进一步研究,形成《2021中国数据资产化工具市场研究报告》。欢迎关注。
本文为系列报道第一篇。中国软件网、海比研究院团队采访了明略科技数据中台负责人——刘国栋。
明略科技数据中台负责人刘国栋
个人简介:全面负责数据中台的产品研发、运营、服务以及数据技术等工作。刘国栋先生毕业于北京大学,计算机专业硕士学位。刘国栋先生拥有超过18年的分布式数据库内核、CEP、搜索引擎、机器学习,数据中台相关工作经验。
在刘国栋看来,数据资产化的本质是发挥数据的价值,而随着数据的价值与数据的变现价值越发接近,数据流通、数据交易开始自由化进行时,数据要素的价值才能真正得以充分发挥。
在向中国软件网讲述数据资产化时,他提到:在国外发达地区,数据作为企业资产的一种类型已成为广泛共识。在欧美体系中,数据作为企业或个人资产的一种类型被认为是与生俱来的,而且有较完善的立法体系支撑。”
那么,为什么国内数据资产化在近些年来才火起来?
刘国栋认为,主要原因是,在国内的产业发展不同阶段中,数据价值的重要性程度展现有所不同。凭借多年的观察,他将国内数据资产化的发展史归纳为四个阶段。在这些发展阶段中,数据在不断发挥更大价值,从而推动了数据资产化的技术发展以及数据资产化工具的出现。
01
起步阶段
发挥企业组织内部辅助角色
在上世纪九十年代中期以前,企业已经出现了数据意识,并受到组织内的法律保护。对企业来讲,企业通过利用数据制作报表、运营等方面的工作,从而发挥了数据的一定价值。
这一时期有一个典型事件——某大型跨国连锁超市“啤酒+尿布”案例:通过复盘销售数据发现年轻父亲们的“啤酒+尿布”搭配式消费行为习惯,进而推动了超市对这类消费群体的个性化营销。
“这一阶段数据的价值主要体现为企业与组织内部的辅助性功能。”
从技术维度上来讲,这一时期的数据资产化工具及工具方法论,主要帮助企业解决两个问题:一是数据记账;二是分析预测。如九十年代中期以前Oracle,Teradata等产品体系。
“我们可以将这个阶段的数据资产工具看作是数据库工具,主要用于存储和查询。”
02
发展阶段
数据辅助功能增强
进入九十年代末期,国内互联网行业进入爆发式发展,带来了大量的数据量增长。“数据量激增,促使数据的搜索推荐、分析功能需求大增。数据对于企业及组织的价值增强,开始从辅助因素向核心因素转变。”
这一时期,出现了一套新技术体系——NoSQL。
NoSQL,结构简单、分布式、易扩展、高效且便捷的新型非关系数据库。NoSQL的出现要解决的问题是,当数据量剧增时,旧数据库已不再能支撑数据之上的应用场景新增变化。比如Cassandra, MongoDB等。
“从技术维度上来讲,这种新变化带来的问题并不很复杂,除了数据量增大外,数据的操作使用仍然简单。”如在2012-2013年时出现的大量移动阅读需求:高并发情况下,要快速检索到一个小说,然后让用户一页一页地翻阅。在这其中,后台核心的支撑是Cassandra,Redis类工具。
而技术人员在做的是,将数据技术体系层层地重构最终完成全栈的重构——这场浩大的工程,掀起了数据技术发展中的史诗级浪潮。
“随着NoSQL的快速发展,我们需要在海量数据上构建更为复杂的场景,即大规模的机器学习,代表工具是Hadoop。”
Hadoop的高速运算和存储能力,帮助企业与组织在海量数据中完成迭代性较强的分析。Hadoop通过不断地对原来的关系模型进行排序更新,在此之中,也形成了算法最核心的数据架构PageRank,从而实现了搜索引擎在海量的、动态的非结构化数据里,更为有效、及时的排序。
“至此,我们可以看到,数据在转换成要素之前,数据资产化管理工具所发挥的是存储性功能,以及更复杂些的是海量数据化分析能力。”
在数据管理维度上,公认的DAMA(国际数据管理协会)标准治理体系出现,以及雨后春笋般的数据管理工具类厂商(后来多经大企业收购)。这一时期的数据管理工具,主要是帮助企业实现数据管理规划、质量、集合、标准以及落地。
“我们需要在海量数据之上,来实现我们经典的数据技术标准,所以又出现了NewSQL(不仅具备NoSQL的优势,更保持了传统数据库支持ACID和SQL等特性)。”
云计算、分布式文件系统、新型的并行计算引擎、支持分布式并行计算的开发语言等技术以及逐渐壮大的生态系统,正处在一个快速发展的阶段,但成熟稳定尚需6-8年。
03
变革阶段
数据向要素转变
“数据开始变成真正的核心要素/核心资产的重要因素是:数据的价值,与数据的市场价值更加接近。”
这个特征,最早和最佳成效出现在互联网金融体系的建立与运营过程中。
例如,2008年淘宝宣布,淘宝是一家数据公司,不是电商公司,不久后,淘宝的数据资产支撑的巨大的、高速发展的互联网金融体系出现了。“这标志着数据真正进入产业、进入市场,变成企业真正的核心要素或核心资产。”
HAO 智能体系 打通感知、认知、行动系统,实现AI闭环落地
要知道当数据发挥辅助决策价值、落地后,需要有一个周期的时间才能得出数据的整个价值迭代规律。而这一时期,数据资产化的发展,促生和推动了巨大的业务创新和全面数字化转型效应,成为市场的新驱动力量,进而数据的价值和变现的价值愈发接近。“由此体现的是,你拥有数据就获得了价值。”
从技术维度上来看,“前两阶段中,数据管理与数据治理技术工具主要是一些低层的架构体系,而到了第三阶段,技术的首要任务是Follow数据法治标准。”
但从使用维度上来看,当前整个行业或整个数据资产使用度上都是非常落后的。“这种落后体现在两个方面:最重要的因素是数据法案还没有完全落地下来,即如何实现数据更加有效流通没有得到解决;其次,技术并不完善,同时市场需求度不够,技术的落地就变得更困难。”
总的来看,这一阶段数据从辅助角色正式转变为核心要素被产业、市场、社会所认可。数据要素的认知建立起来后,企业所考虑的是,怎样管理好数据要素。
04
融合阶段
数据要素应用
数据资产化发展至今,数据的价值应用已经取得了很好的成果。从预测到直接参与生产,在各个行业中都能够看到大量的数据应用案例出现。
越来越多的企业及组织在布局数据要素,并至少已在组织内部使用起来。与传统行业相比,在数据管理、共享、应用方面,政府、金融行业、新能源汽车智造业走在了前列,疫情之下的健康码体系,就是一个很好的场景;一些起步较晚但相对较开放的行业,也涌现出机会与延展性。
数据资产化涵盖了整个生命周期,包括,数据资产收集、分析、评估、管理、应用,以及淘汰废弃。由此凸显了一个问题:数据的含义要比前三阶段中复杂更多,可谓,数据即‘现金’,那么数据怎样才能流动起来?
明略科技 针对结构化数据治理全生命周 期的可视化管控平台
“我认为,只有在法律的充分约束与规范之下,数据才能真正作为一种资产,开始在市场中流通。只有当数据的市场使用环境场景、合规性固定下来之后,数据要素供需应用场景才能真正爆发,从而推动数据的交易。”
不难看到行业赛道之外,数据交易的刚需大量存在。例如基于信用的生意小贷、金融等,这些公司需要更多维度的数据来壮大自身的评估模型,但数据的获取,在目前来讲是十分困难的。
因此,如何建立一个更好的数据交易体系支撑,是第四阶段发展的重要目标。
2020年以来,数据要素如何生成、如何实现生命周期管理、如何在组织内部发挥前所未有的价值,越来越成为企业和组织关注的热点。所有人都知道,数据就在那里,但怎么去发挥它的价值?
“当前,大数据平台储存需求已基本满足,数据要素全生命周期管理成为主要需求点。百分之七八十的企业在做的是数据管理和应用,但数据的市场化供给这扇门还远未打开,不过尝试和探索并未停止,如贵阳大数据交易所等。”
明略的做法是,帮助企业数据进行指标体系化运作,为整个企业做精细化运营,进而输送一种新的业务体系:企业的主营收在哪?企业营收高但为什么净利润低?“在指标体系化运作中,我们就会发现,虽然营收较好,但可能像电费等部分耗费的成本竟远远超过其它营收,于是,据此,我们帮助企业制定新的运作方式。”
明略科技 数据中台技术架构图
“在此过程中,作为数据资产化基础设施的数据中台也在发挥着作用。”数据中台的建设,除了对组织的决策链条和体系进行数字化,还需要对组织的经验、know-how进行系统化、体系化建设,进而将组织的数字化体系与Know-how体系进行结合,搭建起协同机制。
“组织的决策链条体系、经验、know-how,是数据中台建设的核心。明略科技帮助企业及组织打造的是,数据体系结合知识体系的数据中台,可基于数据进行智能决策的数据中台。”