处理非结构化数据的7个实例(附链接)
介绍
https://www.forbes.com/sites/gilpress/2016/03/23/data-preparation-most-time-consuming-least-enjoyable-data-science-task-survey-says/?sh=4b394cc86f63
缺少唯一标识符
不同的命名法
整理来自不同文件格式的数据
语言障碍
最常见的-数据缺失
并不完美的数据架构
来自数据模型中心的图片
不同的日期格式
尾声
https://www.analyticsvidhya.com/blog/2020/12/what-i-did-when-i-had-to-work-with-unstructured-data/
评论