数据资产管理:数据发现,发现什么,怎么发现?
大数据DT
共 4734字,需浏览 10分钟
·
2022-06-27 21:49
导读:今天我们继续聊数据资产管理这个话题。
数据的位置:数据发现通过连接数据源、采集和分析元数据,能够识别企业有哪些数据,并定位这些数据在哪里存放,谁可以访问它。 数据的结构:数据发现可以自动解析数据的结构,包括对结构化、半结构化和非结构化数据的的数据特征提取,通过统计模型对数据进行分类。 数据的传输:数据发现捕获数据的流向,了解传输哪些数据、如何传输以及通过哪些渠道传输。 敏感的数据:数据发现通过内置的数据口径、标准和规则,可以自动识别数据的技术属性和业务属性,可以快速对身份证号码,姓名,地址,手机号、银行账号等敏感信息进行识别、分类和跟踪,方便评估安全或隐私风险并定义缓解策略。 数据的问题:数据发现通过数据质量检核,可以对数据集中的数据值域范围、异常值、错误值、重复数据等数据问题进行稽核,快速发现数据集中的问题数据,并执行数据清理,以提高数据质量。 数据的含义:数据发现通过丰富的图表,通过可视化的方式展示数据资产地图,直观清晰的展现数据富含的意义、用途等,使得用户可以快速的了解数据,并从数据中获得洞察力。
AI 技术可用于数据准备,例如:标准化数据、处理缺失数据、字符串模式识别等。 算法可用于识别和关注相关变量组数据中的特定模式或异常值。 时间序列分析对模式识别、异常值检测和表关系发现具有不同的需求和意义。 可以收集、分析专家用户的行为数据,并用于影响推荐的分析操作。
JMP Statistical Discovery Looker Microsoft Power BI Phocas Qlik Sense Spirion Tableau TIBCO Spotfire Atlan
数据源连接和元数据采集,包括:结构化、半结构化、非结构化等数据源 元数据管理和数据血缘,识别和解析数据的位置、含义等 全文元数据搜索,帮助用户快速定位和查找数据 敏感信息识别、分类和监控,这对于满足合规性要求非常重要 数据准备和提高数据质量的工具 机器学习能力,包括预测分析 内存分析,实现更快的查询响应时间 数据分析和可视化(图表、地图、表格以及其他形式) 版本控制,确保数据的完整性并防止意外数据丢失
延伸阅读👇
延伸阅读《一本书讲透数据治理》
评论