一文读懂元数据的概念、分类及作用
01 元数据的定义
元数据(MetaData)通常被定义为:关于数据的数据(Metadata),或者描述数据的数据(data about data),对数据及信息资源的描述性信息。元数据是所有数据中最重要的数据,也是整个银行业数据和计算机软件的基础。
如体检报告中的 "年龄"、"身高"、"体重"、"性格",就是元数据,因为它们是用来描述具体数据/信息的数据/信息 。
再比如,图书馆的藏书信息卡。视频网站里的视频描述、网络中的网页地址等等都是元数据。
还有“财务状况表”中的属性字段,如:机构名称、项目名称、币种、余额信息等都是这张表格的元数据信息。
02 元数据的分类
元数据按其描述对象的不同可以分3大类:技术元数据、业务元数据和管理元数据。
技术元数据
技术元数据主要用来描述数据实体和数据处理过程中的技术细节和处理规则。比如大家熟知的表结构、ETL映射关系等,这类元数据主要被系统建设的技术人员使用。
在银行业,技术元数据解决了业务系统(如综合柜面系统、信贷业务系统、网络银行系统、电话银行系统等)和管理系统(客户关系管理系统、审计管理系统、财务管理系统等)的数据定义、获取、存储、交换和应用等功能。
业务系统是负责银行与客户之间进行交易的系统,这些系统有数据量大、时效性强等特点。如以“综合柜面系统”为例,“综合柜面系统”要管理上亿的客户信息、账务报表,每天实时处理上亿笔的交易。技术元数据在这些系统里面大部分以数据库定义的形式存在,是各类数据处理的基础。
业务元数据
业务元数据主要是对IT系统的数据实体和数据处理的业务化描述,包括业务规则、业务术语、统计口径、信息分类等。大家经常提及的 KPI定义 和 报表统计规则 等就属于此类元数据。业务元数据主要的使用者是业务人员和公司决策人员。
1、对业务本身描述
如目前银行业可分为3大类产品,资产类、负债类、中间业务类。
资产类产品又可分为短期信贷、长期信贷、贴现类等。
这些业务的描述和定义构成了业务元数据的基础。
2、对业务经营状况的描述
包括对银行产品、银行机构、银行客户经营情况的总的反映。每个分支机构每个时间段、时间点各个产品或业务有不同的业务经营情况。
3、业务管理情况的描述
包括各类业务管理规章制度、经营案例、经营要点难点等。业务元数据在业务管理方面也起到定义管理指标和标准的作用。
对资源的内容、属性进行详细全面的描述,完整反映信息资源对象的基础概貌是元数据的基本功能。
管理元数据
管理类元数据主要是对项目管理、IT运维、IT资源设备等相关信息的描述,这类元数据主要被企业IT部门的管理人员使用,利用此类元数据可以进行工作分配、网络资源等方面的管理。在这里,把管理元数据也纳入到业务元数据研究的范畴,即在本文中元数据只分为技术元数据与业务元数据。
03 元数据的功能
数据地图一般用于在宏观层面组织信息,
以全局视角对信息进行归并、整理,
展现数据量 、数据变化情况 、
数据存储情况 、整体数据质量 等信息,
为数据管理部门和决策者提供参考。
2. 快速搜索
快速搜索定位各类信息系统的数据资产,
用来查询及使用。
3. 灵活视角
支持用户自定义多视角的数据查找,
通过用户预期方式找到所需的数据在什么位置,
并提供数据资产的快速展现。
4. 数据标签
用户可以快速通过数据标签关联
查找出所需的数据位置。
5. 洞察数据资产
提供数据资产分布和数据资产评估自评估功能,
深入了解数据资产的全局情况。
6. 血脉分析
通过元数据血缘关系分析,
可以理解不同数据间的关系。
7. 影响性分析
通过分析数据表之间的关系,
展示数据源波动带来的影响。
8. Mapping展示
帮助用户掌握理解
业务口径与数据口径之间的映射关系,
以用户需要的方式“翻译”出来。
04 元数据的作用
理解数据,建立数据思维
元数据能够有效帮助技术人员和业务人员理解、监督和管理数据的来源、转换规则以及数据变更管理等信息。
提升工作效率
集中式的元数据管理模式,有效提高技术开发人员和数据分析人员的工作效率。
自助式使用数据
提供良好的元数据查询管理视图,可使业务人员独立准确地定位和使用数据。
提高数据质量
有利于构建元数据管理组织、元数据标准和流程,准确定义元数据范围,进而保证省联社各IT业务系统中元数据的完整性和正确性。
跨系统互联互通
有效支持各IT系统之间的数据转换兼容,实现数据共享和互联互通。
企业以元数据为抓手进行数据治理,帮助企业更好地对数据资产进行管理,理清数据之间的关系,实现精准高效的分析和决策。
推荐阅读:
不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)