非结构化数据治理方案
肉眼品世界
共 5363字,需浏览 11分钟
·
2022-05-30 17:03
随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位。日常的业务过程中,需要处理的大量电子文档、图片、音频、视频等,都属于内容数据范畴。
例如,某银行的无人营业网点的远程业务办理中,要求用户上传身份证、签字页等扫描件,来核实用户身份。为其做后端支撑的影像管理平台,就属于典型的内容管理系统。基于该类平台,企业替代了业务处理中的纸质化传输,实现了海量非结构化内容数据的采集、加工、传递及服务的全生命周期的数据整合,大幅提升了生产效率。
内容管理系统,除了管理非结构化的内容数据(如图片、语音、视频等),还需要实现内容文件的元数据(如文件标签)的管理,才能为业务系统提供服务,如批次上传/下载、标签化、全文检索、生命周期管理、文件加工转存、断点续传等。
推荐阅读:
不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)
评论
了解结构化数据与非结构化数据的差异
介绍数据用途广泛,有多种形式,并且可以通过多种方式进行组织。一种常见的分类是结构化或非结构化数据,具有不同的存储、处理和分析方法。了解这些差异有助于从任何数据集中提取有价值的见解。结构化数据与非结构化数据:主要区别结构化和非结构化数据在许多方面都有所不同。两者都使用不同的工具和方法来处理和分析信息。
数据工匠俱乐部
1
数据治理之元数据治理
元数据是描述数据的数据,用于打破业务和IT之间的语言障碍,帮助业务更好地理解数据。元数据被认为是数据治理的基石,元数据治理贯彻数据产生、加工、消费的全过程,沉淀了数据资产,搭建了技术和业务的桥梁。本文介绍什么是元数据和元数据管理,以及常用的元数据管理策略、方法和技术01什么是元数据元数据是关于数据的
数据工匠俱乐部
1