干货丨深度迁移学习方法的基本思路
↑↑↑点击上方蓝字,回复资料,10个G的惊喜
本文选自《深度学习500问:AI工程师面试宝典》,将重点介绍目前最热门的深度迁移学习方法的基本思路。
▼限时5折,扫码了解详情▼
▼
随着迁移学习方法的大行其道,越来越多的研究人员开始使用深度神经网络进行迁移学习。与传统的非深度迁移学习方法相比,深度迁移学习直接提升了在不同任务上的学习效果,并且由于深度迁移学习直接对原始数据进行学习,所以它与非深度迁移学习方法相比有两个优势。
(1)能够自动化地提取更具表现力的特征。
下面我们来重点介绍深度迁移学习方法的基本思路。
1 深度网络的可迁移性
结论:
虽然论文[Yosinski et al.,2014]并没有提出创新的方法,但通过实验得到了以下几个结论,这对深度学习和深度迁移学习的研究都有着非常好的指导意义。
(1)神经网络的前3层基本都是通用特征,进行迁移的效果比较好。
(2)在深度迁移网络中加入微调,效果提升会比较大,可能会比原网络效果还好。
2 微调
深度网络的微调(Fine-Tune)也许是最简单的深度网络迁移方法。简而言之,微调是利用别人已经训练好的网络,针对自己的任务再进行调整。从这个意义上看,不难理解微调是迁移学习的一部分。对于微调,有以下几个常见问题。
● 微调实现简单,我们只需关注自己的任务即可。
3 深度网络自适应
▊ 基本思路
(1)决定哪些层可以自适应,这决定了网络的学习程度。
AdaBN方法与其他方法相比,实现起来相当简单,不带有任何额外的参数,在许多公开数据集上都取得了很好的效果。
4 深度对抗网络迁移
生成对抗网络GAN(Generative Adversarial Nets)是目前人工智能领域的研究热点之一[Goodfellow et al.,2014],它被深度学习领军人物Yann LeCun评为近年来最令人欣喜的成就。由此发展而来的对抗网络,也成为提升网络性能的利器。本节介绍深度对抗网络用于解决迁移学习的基本思路及其代表性研究成果。
图书推荐
▊《深度学习500问:AI工程师面试宝典》
谈继勇 主编,郭子钊、李剑、佃松宜 副主编
Github 标星4.2万的火爆之作
历时3年,融合产学研的精心制作
集百家所长,凝聚了众多一线科研人员及工程师的经验
让你不再因为缺乏基础知识而对深度学习望而却步
细化问题,助你面试查漏补缺,重点突破
兼具广度与深度,深度学习知识框架的全景图呈现
本书凝聚了众多一线科研人员及工程师的经验,旨在培养读者发现问题、解决问题、扩展问题的能力。本书内容取材于编者在日常学习过程中总结的知识点及各大公司常见的笔试、面试题。是一本兼具广度与深度的著作。
新书活动限时5折
(扫码了解本书详情)
也可以加一下老胡的微信 围观朋友圈~~~
推荐阅读
(点击标题可跳转阅读)
老铁,三连支持一下,好吗?↓↓↓