机器学习中必要的数学基础!
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
作为一门基础性学科,数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算法的先决条件,也将帮助我们更深入透彻地了解算法的内在原理。所以,本文作者阐释了数据科学和机器学习为何离不开数学,并提供了统计学与概率论、多变量微积分、线性代数以及优化方法四个数学分支中需要熟悉的一些数学概念。
本文的作者是物理学家、数据科学教育者和作家 Benjamin Obi Tayo 博士,他的研究兴趣在于数据科学、机器学习、AI、Python 和 R 语言、预测分析、材料科学和生物物理学。
Ggplot2
Matplotlib
Seaborn
Scikit-learn
Caret
TensorFlow
PyTorch
Keras
数据集有多大?
特征变量和目标变量是什么?
哪些预测特征与目标变量关联最大?
哪些特征比较重要?
是否应该扩展特征?
数据集应该如何划分成训练集和测试集?
主成分分析(principal component analysis, PCA)是什么?
是否应该使用 PCA 删除多余特征?
如何评估模型?用 R2 值、MSE 还是 MAE?
如何提升模型的预测能力?
是否使用正则化回归模型(regularized regression model)?
回归系数是多少?
截距是多少(intercept)?
是否使用像 K 近邻回归(KNeighbors regression)或者支持向量回归(support vector regression)这样的无参数回归模型?
模型中的超参数是多少?如何调整超参数使模型性能达到最佳?
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
评论