小马的零基础机器学习推荐
“
阅读本文大概需要 7 分钟。
哈喽大家好,这里是编辑部小马。今天想分享我自己的机器学习入门的感想,希望能对大家有借鉴价值。
我本人(小马,不是崔哥)本科其实是自动化毕业的,目前在北京读研,读研期间转的数据挖掘方向,开始学习 Python。学习编程是个大趋势,别说是自动化专业本身就有涉及,很多经济学甚至是心理学这种看似无关的研究生同学,也都在学习相关的内容。但一开始的学习非常痛苦——尤其是之前完全没有学习过编程、数据库、没有其他任何基础的朋友,处于非常强烈的困境,Python虽好,我手不巧。(文末会推荐免费的基础课资源 !)
幸好我刚开始学机器学习的时候就开始跟崔老师谈恋爱了。
啊不是
我的意思是, 因为种种因缘巧合,我在学习机器学习的路上一直有崔老师的帮助。
当时崔哥给我订计划的时候,本身是定了一系列的书单的,一本一本的往下续的那种。
但是,书是真的很难看。
我不是说人家书写的不好的意思,但是我有的时候看起来的时候就像过流水账。
贝叶斯,点点头
K-NN,点点头。
这本书合上,我的大脑还是空空如也。
另外网上也有一些免费视频资源,但一是不系统,二是我遇到问题老得吧得吧问崔哥,我们爱情的花朵枯萎的太快。
所以我就走了另一条路——知识付费。我跟崔哥挑选了几个,最后综合价格和内容选择了 Udacity 的机器学习(全球三大专业在线学习平台之一,应该很多人听过)。在这里我就不讲理论上的学习路径,只说一些初学者经常遇到的问题和我的建议。
1. 项目的重要性
就像前面提到的,初学者的一大误区就是,我先自己看看视频、看看书学。
编程是一项实战技能,光理解公式是远远不够的。没有实战与练习、不做项目,永远是纸上谈兵。“Learning by doing”才是适合这种实战型技能的学习方式。
以我所学习的机器学习工程师为例,每个章节过后,都有一个项目实践的内容。包括航班延误预测、人脸识别、部署情感分析模型以及抄袭检测器四个项目。该实践对每一章的内容进行整合,每个实践做完之后需要进行上传,上传的过程中也可以跟 reviewer 留言提问。
为什么说 code review 很有用呢,reviewer 和机器的区别就是,机器只能告诉你哪里错了,但真人导师会告诉你哪里好、哪里不好、可以怎么改进。coder reviewer 会对项目中的每一步给出相应的建议。
除此之外,社群助教也会提供很多帮助,而且助教中有很多隐藏的大牛(比如崔哥就真的在Udacity当过助教来着)。
2. 英语的重要性
这一点可能之前可能很少有人提到。其实我在读研的过程中是有专门机器学习这门课的,在接触这门课的时候并不能说是完全的新手,但我仍然在上前两节课的时候记了非常多的笔记。
80% 学习机器学习的过程都是为了科研/工作,而为了超越 baseline 我们就需要先看懂别人的 baseline。因此能在入门的时候就学会英文思考是非常重要的。中文是舒适圈的同时也是阻碍圈。你并不是非得用英文学,但是一定要知道这些内容对应的英文是什么,语言是学习的工具,而不是限制。
这里插一句,随着 Sundar Pichai 成为了谷歌的 ceo,原本占硅谷 50% 的华裔工程师基本退出了高管舞台。谷歌终于也加入了微软、百事、德意志银行、MasterCard、Adobe 和伦敦消费品交易巨头 Reckitt Benckiser 的队伍,开始了公司全新的“咖喱人生”:印度工程师越来越多。今天的硅谷,几乎成为了香蕉飞饼的硅谷。(我很爱吃香蕉飞饼的,不是黑) 这种讨论不止于东方,在 geekforgeeks的最新报道中,记者也问出了这个问题——“为什么是印度工程师”
回答:“因为英语。”
“印度人精通英语,与中国和日本的高管相比,他们的英语说得非常流利。也许他们(其他国家)的产品是好的,但如果他们不能以吸引人的方式与世界沟通,那就毫无价值。我们可以认为这是英国在印度殖民的一个奇怪的好结果,而不是无数的坏结果。“ 这正是很多工程师的问题所在。你不但不能把自己推荐给别人,别人也不能发现你。
3. 对原理抽丝剥茧
整个学习过程其实让我很着迷……除了前面提到的阶段性项目,课程也不是简单的让你看视频,而是有非常多的实时互动,比如每10分钟,会问你一个问题,或者让你写一段代码。
关键,他说的是人话... 完全不像是大学老师那样照本宣科,课程中还大量使用了充满“美式幽默”的情景剧、对话、访谈等等。感觉对零基础的“小白”学生也是很好的体验。
课程从不要你死记硬背——将公式4代入公式3的时候就能得到公式5,我们用公式五进行判断模型优劣……
它的内容是通过循循善诱的方式,告诉你我们用的公式 3 是为什么写成这个样子的,我们以什么理论写了公式,他有什么问题,我们因此要做什么改进。我们代入公式4能做出什么改进,最后得到的东西会是一个什么效果。
因此 Udacity 不能 30 天把你培养成工程师,要至少 180 天。
举个简单的例子:
Uda 也不太嫌麻烦,每一个课程都是动图。讲线性回归,就让你慢慢看着随着线的滑动,随着斜率和y轴交点的变化,什么叫回归,怎么做到回归,而回归公式又是在怎么样一个情况下产生的。这就像是很经典的高考问题,你不是不能上来直接背过几何的公式,但是你是长期的理论的学习和理解,让你在高考之后十年还可以记住这些——正如 Uda 所做的一样。
4. 证书:
我知道你你门学习主要是为了掌握知识,但如果你有这么一点点功利的想法,比如想选择一个权威的平台,Uda也能满足 —— 毕业的纳米学位证是可以添加至 LinkedIn 简历的。Udacity 的证书因为都是和名企合作开发,也天然受到企业认可,比如机器学习的合作企业就是 Amazon 和 Kaggle。
重点来了,Udacity 的几个明星课程都可以免费试听,很多数学的基础课资源还都是免费的,只不过很多人不知道。近期 Udacity 中国区还有一个「2020新年奖学金」,有机会赢 600-1000课程奖学金,适用于所有明星纳米学位,12月12日已经开放申请了,感兴趣的同学可以先申请起来!
三个重要福利1.2020新年奖学金申请入口2.机器学习免费试听、数学基础课3.详细课程大纲、选课指南
扫码可以自动获取,就都在下面的公众号里啦!
最后,这个免费试听,我真的劝大家都去看看,尤其是像我一样的有科研要求的研究生,或者想把自己从CSDN拔高到Github的工程师。(反正试听不要钱)
最后点击阅读原文,可以到官网了解更多~