数据分析师技能树

Python面面观

共 1169字,需浏览 3分钟

 ·

2021-01-19 21:38

每隔一段时间,都会整理下自己的技能树,看看有哪些可以再加上去,然后平时学习时,沿着技能树的内容查漏补缺。下面是最近整理的,觉得还有需要补充的同学可以留言说一下。

MySQL

  • 基础查询语句:查询语句 select、表来源 from、条件语句 where、数据分组 group by、数据过滤 having、数据排序 order by、限制行数 limit;
  • 多表查询语句:内连接(join/inner join)、左连接(left join) 、右连接(right join) ;
  • 条件函数:case when、if;
  • 聚合函数:求和 sum()、均值 avg()、计数 count()、最大值 max()、最小值 min();
  • 窗口函数:
    • 累计计算窗口函数:sum()over(partition by ... order by ...)、avg()over(partition by ... order by ...);
    • 分区排序窗口函数:row_number()over()、rank()over()、dense_rank()over();
    • 分组排序窗口函数:ntile()over();
    • 偏移分析窗口函数:lag()over()、lead()over();
  • SQL定义与操作语言:创建表 create 、插入语句 insert into 、更新语句 update 、删除语句 delete。

Python

  • NumPy、Pandas、matplotlib库;
  • sklearn 库。

机器学习

  • 算法模型:决策树、随机森林、回归模型、K-Means聚类、K近邻、贝叶斯、支持向量机、Apriori关联规则等;
  • 特征工程:特征缩放/归一化,分类变量,数据降维,特征选择。

统计学

  • 描述统计:频数分析、集中趋势、离散程度、数据分布;
  • 参数估计:总体、个体、样本;点估计和区间估计;中心极限定理;正态分布;
  • 假设检验:双边检验、单边检验;Z检验、t检验、卡方检验、F检验;
  • 线性回归:一元线性回归、多元线性回归、损失函数;
  • 时间序列分析:AR、MA、ARMA、ARIMA模型。

思维

  • 认知:PEST、5W2H、SWOT、4P理论、用户行为理论,波士顿矩阵,二八原则;
  • 数据:AARRR,用户增长。

Tableau

  • 工作表、仪表盘和故事;
  • 可视化:柱状图和条形图、折线图和面积图、饼图和环形图、散点图和气泡图、箱线图。

数学

  • 线性代数
  • 微积分
  • 概率论

大数据

  • Java,Linux,Hadoop,Spark,Hive,ETL,Flink。

其他技能

  • SPSS、Excel;
浏览 37
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报