【机器学习】图解 72 个机器学习基础知识点
1. 机器学习概述
1)什么是机器学习
![](https://filescdn.proginn.com/81d1871963ebd32e10902929ac92d777/a5b66a6f277a37e20a8c6114e8209f97.webp)
![](https://filescdn.proginn.com/842c4d41466b9c7e4b0cdcf47cf18bb9/97c2629fc55e62b75d71ce76a84dc507.webp)
![](https://filescdn.proginn.com/32455ff4882612cb3f877a27639b56f8/a29991765fdf216bea02ab2ba01fb86b.webp)
![](https://filescdn.proginn.com/060e2b66d397427cd2a5005148b67583/2996bf5116f89cfc35166383f907c27f.webp)
2)机器学习三要素
![](https://filescdn.proginn.com/3faa4a617cfcaa8474b5a930863235a1/b947e7c075320183c60a714953083689.webp)
(1)数据
(2)模型&算法
3)机器学习发展历程
4)机器学习核心技术
5)机器学习基本流程
6)机器学习应用场景
2.机器学习基本名词
3.机器学习算法分类
1)机器学习算法依托的问题场景
更多监督学习的算法模型总结,可以查看ShowMeAI的文章 AI知识技能速查 | 机器学习-监督学习(公众号不能跳转,本文链接见文末)。
更多无监督学习的算法模型总结可以查看ShowMeAI的文章 AI知识技能速查 | 机器学习-无监督学习。
2)分类问题
了解更多机器学习分类算法:KNN算法、逻辑回归算法、朴素贝叶斯算法、决策树模型、随机森林分类模型、GBDT模型、XGBoost模型、支持向量机模型等。(公众号不能跳转,本文链接见文末)
3)回归问题
了解更多机器学习回归算法:决策树模型、随机森林分类模型、GBDT模型、回归树模型、支持向量机模型等。
4)聚类问题
了解更多机器学习聚类算法:聚类算法。
5)降维问题
了解更多机器学习降维算法:PCA降维算法。
![](https://filescdn.proginn.com/b1eec0c39eb1b9181e1765301eb84ce1/7413d61f5ec3979f172606e703d593e3.webp)
4.机器学习模型评估与选择
1)机器学习与数据拟合
2)训练集与数据集
3)经验误差
4)过拟合
5)偏差
8)性能度量指标
(1)回归问题
(2)分类问题
![](https://filescdn.proginn.com/d4420104a9920ab94560ac8a31a9a8be/d67e556ef1376f3bd6c803d5e02fa5b0.webp)
![](https://filescdn.proginn.com/27a6b0220b8167b16c863375eae689a6/79de16dddd0acf3c6f6ebca13211d32a.webp)
从一个比较高的角度来认识AUC:仍然以异常用户的识别为例,高的AUC值意味着,模型在能够尽可能多地识别异常用户的情况下,仍然对正常用户有着一个较低的误判率(不会因为为了识别异常用户,而将大量的正常用户给误判为异常。
9)评估方法
![](https://filescdn.proginn.com/9eba2fd6bd0fc2dd3a6838c848231a90/1443d2ef133a101878ef3d8f7a3a1a56.webp)
![](https://filescdn.proginn.com/27101e63c0f75f6e421af94374eff834/ace6116872243d30883cc19989cb114e.webp)
![](https://filescdn.proginn.com/a83da5b3c7ed669e478cd95de90627e7/1ed5f7e71bb310e5ecc6697526c6716e.webp)
![](https://filescdn.proginn.com/1406839456f219bc0cce0672148ac300/2f2a68f64662cdcf39c77e736df88081.webp)
10)模型调优与选择准则
表达力好的模型,可以较好地对训练数据中的规律和模式进行学习;
-
复杂度低的模型,方差较小,不容易过拟合,有较好的泛化表达。
![](https://filescdn.proginn.com/b058a918a2f1d24662ee61e6da8ccda1/d4d1ea4e3743e36d72febe146b940f2d.webp)
11)如何选择最优的模型
(1)验证集评估选择
切分数据为训练集和验证集。
对于准备好的候选超参数,在训练集上进行模型,在验证集上评估。
(2)网格搜索/随机搜索交叉验证
通过网格搜索/随机搜索产出候选的超参数组。
对参数组的每一组超参数,使用交叉验证评估效果。
选出效果最好的超参数。
(3)贝叶斯优化
-
基于贝叶斯优化的超参数调优。
往期精彩回顾
适合初学者入门人工智能的路线及资料下载 (图文+视频)机器学习入门系列下载 机器学习及深度学习笔记等资料打印 《统计学习方法》的代码复现专辑
机器学习交流qq群772479961,加入微信群请扫码
评论