斯坦福CS329S:机器学习系统设计,课程、笔记上线了!
这是一门新的课程——在学习了算法、框架等内容后,是时候深入了解一下「机器学习系统设计」了!
具备基本的计算机科学原理和技能知识,能够编写一般的计算机程序(比如完成了 CS106B / X 等课程);
对机器学习算法有着良好的掌握(比如完成了 CS229、CS230、CS231N、CS224N 等课程);
熟悉至少一个框架,比如 TensorFlow,PyTorch,JAX;
熟悉基本的概率论(比如完成 CS109 或 Stat116 等课程)
何时使用机器学习
研究中的机器学习与生产中的机器学习
机器学习系统与传统软件
机器学习生产中「虚构」的那些事儿
机器学习应用
Case Study
好的机器学习系统的原理
迭代过程
计划范围
现实世界的数据挑战
如何收集、存储和处理海量数据
数据 pipeline 的不同层
数据处理器 & 显示器
数据控制器
数据存储
数据提取:数据库引擎
特征工程
数据标签
数据泄露
数据分区、切片和采样
Baseline
模型选择
训练、调试和实验跟踪
分布式训练
评估和基准
AutoML
推理约束
模型压缩与优化
训练服务偏差
概念漂移
服务器端 ML & 客户端 ML
缓释策略
部署评估
道德问题
监控内容
指标、日志记录、标签、警报
更新和回滚
迭代改进
架构选择
硬件设计
边缘设备
云私人数据中心
高性能计算的未来
模型性能与业务目标与用户体验
团队架构
为什么机器学习项目会失败
最佳实践
机器学习生产现状
评论