电脑里面攒了20G机器学习视频,为何我还没入门?
共 4084字,需浏览 9分钟
·
2020-12-07 08:10
最近项目上线,昏天黑地。外卖吃到想吐,披萨、炸鸡、薯片看见就想吐,秋天的第100杯奶茶喝到想吐。
上周系统终于成功上线,我带着队里面的几个小朋友到我铁哥们财哥家里喝酒到深夜。财哥和我认识快10年了,10年前他还在马来西亚橡胶园的树上割橡胶,后来他凭着谜一样的自信学了编程,飘洋过海,竟成功入职我司。用财哥的话说,他是全亚洲最会割胶的程序猿。后来我俩熟了,每次我抱怨在厂里做项目太辛苦时,财哥就和我说,这有什么辛苦,你中午12点外面40多度时候爬到20多米树上割橡胶不辛苦。
喝累了,几个小朋友说看个片儿吧,财哥说新片老片都有啊,说着就要点开。我心说慢着啊财哥,这种目录你也敢直接打开。。。
不过,说时迟那时快,喝高了的财哥已经把文件夹点开。新下的视频目录里面的内容是这样的:
全体人开始暴笑。我说财哥啊,这都哪儿跟哪儿啊,你这学习资料咋比电影还多?从Python,到数据分析和数据运营,到很火爆的数据中台,到Dockers和K8S,分布式系统开发,再到云计算,一直到AI的技术硬核机器学习和深度学习,整个一IT热门技术图书馆。
财哥回答:你们懂啥啊,我这老搬运工了。每下一部电影,必须同时下一部学习视频,不然我落后了,你让我回东马沙巴州,做全亚洲最会编程的割胶工吗?
我们赶紧说:以财哥的学习能力那不能绝对不能,您永远是最会割胶的程序猿,您持续学习和进取的精神永远值得我们学习。技术的更新这么快,不管老兵还是新兵,哪个不是在不间断的学习新知识,新技术呢。我虽然没割过胶,可我的本科和研究生同学们也都毕业十多年了,有的做产品经理,有些做互联网运营,有的37、8岁之“高龄”仍然坚守在程序员的岗位。大家都是时时刻刻准备着,随时开启新的“学习”之旅,才赶得上这个AI、物联网+5G的新时代啊。
非常不幸运,原本一个只喝酒看片的夜晚,却被财哥视频文件夹里的小插曲把调子又调的高大上起来了。财哥说:“我的这些视频里面,就机器学习的内容多,整整20G,不过你要问我其它技术还好,说到机器学习,我还是迷糊,里面公式和算法太多”。刚好我自己的团队也正做AI产品嘛,我们的这些刚毕业的年轻人也纷纷说,的确的确,感觉那些视频课里面的内容和工作中的实际需求还真的是有很大Gap的,要说光通过这些视频上手项目,还真是不大容易。
这让我想起来前些年我刚刚接手机器学习项目时候,的确有相同的困惑。我一直是做SAP方面的东西,而那时候我的项目是出现了一个Fraud Analysis(欺诈分析)的需求,需要在BI系统中加入机器学习的元素,当然整个机器学习,就是Machine Learning和Deep Learning对我来说都是很新的词,听起来就觉得神秘。看了一些资料,书,视频什么的,时间花了不少,但是感觉并没有建立起机器学习的体系框架,甚至连机器学习的本质是什么都没有全面把握到。然后项目周期不等人,我只能干中学,摸爬滚打,连着问同事,多多请教有经验的人。而大家都知道,最有经验的人,其实也就是项目里面最忙的人,他们的时间宝贵到你明明知道他们几句话就能够解除困扰你一个礼拜的疑惑,但是你就是不好意思开口打扰。
如此这般,整整过了小一年左右时间,项目也基本做完了,我才基本上跌跌撞撞的摸索进入了机器学习的大门,然后开始新的项目,开始带着自己的团队继续摸着石头过河。
我就认真思考了一下,为什么我花了那么长的时间,才勉强能够比较顺畅的谈机器学习。比起其它知识点相对“单一”的技术来说,机器学习的入门之旅容易让人迷茫。为何?我个人感觉有三个原因:
· 机器学习不是一个单一技术,而是一系列技术的集合;
· 机器学习是AI的关键技术,而AI,也就是人工智能,听起来就令人望而却步;
· 机器学习要求底层知识最广,包括线性数学、统计学、概率、微积分、程序设计和算法等
上面这些因素叠加起来,让人觉得我要从头学起这么多的基础知识,想想都十分令人头疼。很多人因此选择了学一些比较单一的技术栈,比如K8S,比如分布式开发。
但我觉得因为“迷茫”而放弃,是十分可惜的事情。尤其是机器学习作为AI的核心,在几乎所有的互联网、大数据和物联网应用中都广泛应用。不论是做开发,做产品,还是做数据运营,都应该掌握机器学习的基本知识。
下面我尝试给出大家打开“机器学习”世界的快捷方式,并不是为了教多少机器学习知识,而是给出一些经验和理念,扫清“迷茫”的感觉,迅速上路。
这里有三个经验分享:
第一,关于学机器学习之前所需要拥有的数学和编程知识,多少才够。问一下你自己,学习的目的是为了去Google优化最新的搜索算法,成为资深数据科学专家;还是要在你当前的项目中用已有的机器学习框架和库解决一些实际问题?如果是前者,我无法给出指导性的建议,但如果是后者,大学毕业的理科生,不需要复习任何一门课程,凭着当年读书考试时临时抱佛脚的基本知识,就足够开始了。我就是大概半年多到一年的时间,零基础进入机器学习领域,并开始管理项目,而我本人的数学和编程基础并不是很强。
第二,关于入门的书籍和课程,目前市场上面已经多如牛毛,千万千万不要先把自己的电脑硬盘塞满20G资料后再开始学习。机器学习的书籍一定要精挑细选,选择一到两个教程作为入门即可。一定要选择精品,切记切记。这里仅给出几个我从中受益过的教程:
· 吴恩达老师的视频课,优点,地球上学机器学校的人都知道,开创机器学习教学视频之先河;不过,吴老师的教学课件是Matlab,现在其实用的人比较少了。
· 李宏毅老师的视频课,李老师讲课通俗易懂、课程案例生动有趣,课程中宝可梦Pokemon常常上阵,而且李老师每年都会在视频中增加新内容。
· 林轩田老师的《机器学习基石》课程由浅入深、内容全面,作为机器学习的入门和进阶资料也是非常适合的。
· 周志华老师的机器学习西瓜书,是国内版最畅销,最有影响力的机器学习书籍。西瓜书相对来说理论内容多,作为入门书籍,对数学要求偏高。
第三,在具体开展机器学习相关工作之前,如何实操项目实战,这也很令初学者头疼。数据集如何找,如何选择;有了数据集之后如何选择机器学习算法,如何知道自己的算法是否合适,这些问题对于初学者来说,需要耗费的时间和精力太多了。但是没有这些具体的实操演练,又不能产生出机器学习的“直觉”,谈不上是机器学习的业内人士。在这一点上,一本优秀的难度不高的实战型入门书籍,会给你一种“师傅领进门”的感觉。然而,这样的书籍,在市场上比较少见。
好,我的努力还并不仅限于此。因为我觉得,在时间如此宝贵的时代,虽然自己一年之内上手机器学习的速度颇值得夸耀,但是也没有什么了不起,能不能够把自己学习过程中的这些东西总结总结,输出一本能读能用,有益有趣的机器学习入门资料。目标就是让项目组里的各位小伙伴们,三个月内入门机器学习,尽快开展实战?目标很简单:三个月入门。
嗯,从产生这个想法开始,还真一发不可收拾。不仅公司小伙伴们觉得这份资料和课程太实用,大大缩短了他们入门和进阶的时间。而且,大家觉得太值得把这份资料总结成书,于是乎,就有了今天要问大家安利的人民邮电出版社的机器学习书——《零基础学机器学习》(黄佳著)。
这本书对基础薄弱的同学来说超级贴心!可以说是专门为数学、编程、实战经验都相对有限的学生和IT从业者量身定制,在最短的时间内领略机器学习的逻辑魅力。
举几个栗子让你们体会一下~
1. 内容太多,不知道如何开始学习怎么办?
不怕,这本书有独具匠心的故事性教学安排。为了完成老板交代的项目,菜鸟程序员小冰“被迫”拜师机器学习专家咖哥,从此开启了一段神奇的机器学习之旅。这本书完全从一个初学者“小冰”的视角展开学习,跟着小冰的步骤和咖哥的思路,读者也自然而然的被引入机器学习的殿堂。
→首先是快速入门,了解机器学习的家族关系、平台、常用术语、实战架构等一切需要了解的背景知识。
图片注释水印(所有的术语都图文并茂的解释清楚)
→然后用一天时间,搞定涉及的相关数学和Python知识。
图片注释水印(基本的数学和编程知识都会捡重点简单过一遍)
→接下来就是实战,从实战中掌握机器学习的硬核技能。
(注释:先了解机器学习的项目架构,然后在大量的实战项目中加强印象)
2.问题来了,入门那么快,万一概念看不懂怎么办?
也不怕,故事中的老师“咖哥”考虑到了这一点,机器学习课堂随时有问题随时提问。
3.机器学习、人工智能,看上去就挺深奥的,会不会很枯燥呢?
这个嘛,放一些内容你们实际感受下。
比如:
注释:用图展示文本向量化的过程
注释:这样解释决策树算法处理相亲数据集
注释:图文并茂生动展示机器学习内涵
4.机器学习要用到很多数学知识,刚入门的话,是不是要把这些数学公式推导一遍呢?一想就觉得好累哦。
全书没有几个公式,有公式也完全能看懂。(担心数学基础差的同学可以放心了,这本书简直是手把手的把机器学习初级阶段所需要的数学知识全都撸了一遍。)
注释:用图片和比喻展示梯度下降的数学推导过程
(例子图)
4.这本书学了能用在哪里呢?会不会学了不好落地呢?
大厂专家“咖哥”精挑细选了很接地气的诸多机器学习实战案例,手把手的实战,调优,一步一步攻克各个机器学习知识点。
图片注释:在实战的过程中出错
图片注释:进行一次一次的尝试
图片注释:通过多次失败和调试,才能发现最后的“通关”之路
重点来了,这本书的购买链接是:https://item.jd.com/12763913.html
总之,接地气,实战,快速入门是我的创造目标!实现与否,需要您来检验!如果您也正要开始“机器学习”的旅程,要不要入手一本《零基础学机器学习》,和“咖哥“与”小冰“一道,轻松而快捷的打开机器学习的世界呢?