真正的数据专家来了!
基础篇,17份
一共17份文档,都是大数据底层的文档,没有太多花花肠子,拿来就能直接干活的那种:
03+hive任务开发规范.doc
架构篇,17份
大数据架构师关注的是什么?更多的是架构选性、OLAP层面的东西,所以这里精选了架构图、产品选型以及各种主流OLAP的文档,原理和实践都有,正好也是17份:
4-4Flink-1.11 Hive集成与批流一体(3).pdf
4. ClickHouse在苏宁用户画像场景的实践.pdf
7-2优酷大数据 OLAP 技术选型.pdf
Apache Doris在京东搜索实时OLAP中的应用.pdf
ClickHouse官方中文文档.pdf
ClickHouse原理解析与应用实践.pdf
DorisDB原理剖析 和应用实践篇_2021.pdf
Doris竞品对比.pdf
Doris在美团外卖数仓架构中业务实践与改进思路.pdf
Flink 流批一体的技术架构以及在阿里的实践.pdf
Flink实时仓库实践.pdf
Hadoop开源相关,Flink,Kylin等集群搭建.docx
KylinCloud+Hudi实践.pdf
Kylin–基于Hadoop的大规模联机分析引擎_20210303_202427.pdf
阿里数据湖选型ppt.pdf
各种系统架构图与详细说明.docx
关于bi工具选型的参考依据.doc
数仓篇,17份
数据仓库整体设计方案模板-彭文华.docx
数据仓库建设规范模板.pdf
数据仓库建设方案.docx
商业银行数据仓库系统V2.0.pptx
内部分享-基于 Hudi 和 Kylin 构建准实时高性能数据仓库.pdf
模板6-报表需求梳理.xlsx
模板5_公共数据资源管理分析模板.xlsx
模板4_公共数据资源管理调研模板.xlsx
模板3_访谈提问和沟通记录单模板.xls
模板2-命名规范.xlsx
模板1-数据仓库项目计划.xls
模板-指标体系梳理.xlsx
模板-业务梳理.xlsx
模板-维度梳理.xlsx
模板-事实表梳理.xlsx
传统数仓与大数据数仓区别.xlsx
Hadoop构建数据仓库实践1.pdf
治理篇,17份
大数据治理,也是一个巨复杂的事情。简单来说需要有元数据、安全、授权(atlas、ranger、sentry大数据治理三剑客),复杂一些就多了,指标体系、模型规范、主数据、组织等等。一样,还是17份资料给你!
2.快手从模型规范开始的数据治理实践-孙伟.pdf
Apache atlas使用说明文档.pdf
apache-ranger-1.2.0.tar.gz
atlas安装.pdf
CDH启用kerberos身份认证和sentry权限管理.docx
dama-部委级数据治理项目经验分享-彭文华.pdf
GrowingIO 2020指标体系与数据采集.pdf
GrowingIO公开课:搭建业务+数据一体化的指标体系.pdf
IBM 数据治理统一流程.pdf
ISO38500 IT治理国际标准 ISO_IEC_38500_2008_version_PDF.pdf
第12章元数据管理-DAMA-DMBOK:数据管理知识体系(第二版).pdf
权限管理设计方案.doc
数据安全模板-访问权限梳理表.xls
数据治理服务解决方案.doc
数据治理及数据资产化创新实践-京东.pdf
万振龙:数据治理与大数据平台设计.pdf
主数据管理实践白皮书(1.0版).pdf
案例篇,31份
2. Clickhouse玩转每天千亿数据-趣头条.pdf
2. 腾讯 clickhouse实践 _2019丁晓坤&熊峰.pdf
4.微博基于Flink的机器学习实践_final_version_v2的副本.pdf
5-快手稳定性体系建设0721.pdf
5.快手元数据平台化建设及应用场景-薛言.pdf
6.快手指标规范化及OneService平台化实战-刘一凡.pdf
ClickHouse 在头条的技术演进.pdf
Doris的用户画像人群应用-会议组.pdf
Doris在美团外卖数仓架构中业务实践与改进思路.pdf
Flink 在 OPPO 的平台研发与应用实践.pdf
Flink实时仓库实践.pdf
Flink在滴滴的应用实践-刘雨飞(1).pdf
【01-邹丹-字节跳动】Apache Flink®在字节跳动的实践.pdf
【02-余海琳-滴滴】Flink在滴滴出行的应用与实践.pdf
【03-邓小勇-阿里】基于Flink的实时计算平台.pdf
【03-马汶园-菜鸟】菜鸟在物流场景中基于Apache Flink的流计算实践.pdf
【1】Hudi on Flink在顺丰的实践应用-蔡适择.pdf
博文-Apache Flink 在美团的实践与应用.pdf
曹福祥-快手服务治理平台+KESS+的设计理念和实战.pdf
快手-倪顺-快手数据中台建设:大数据服务化之路.pdf
快手-张蕤-快手离线数据全链路分级保障平台化建设.pdf
快手万亿级实时 OLAP 平台的建设与实践.pdf
李振炜-ClickHouse在快手的大规模应用与架构改进.pdf
美团点评酒旅数据仓库建设实践.pdf
美团酒旅数据治理实践.pdf
美团外卖为何使用Doris创建数据仓库.pdf
内部分享-基于 Hudi 和 Kylin 构建准实时高性能数据仓库.pdf
实时数据产品实践——美团大交通战场沙盘.pdf
苏宁易购-杨兆辉-ClickHouse在苏宁用户画像场景的实践.pdf
腾讯云clickhouse性能调优实践.pdf
王祥虎,杨华-融合趋势下基于 Flink Kylin Hudi 湖仓一体的大数据生态.pdf