【深度学习】终于学会调参了!!你有哪些deep learning(rnn、cnn)调参的经验?

共 1055字,需浏览 3分钟

 ·

2023-02-04 18:53


各位好,我是DASOU。

前两天在B站直播讲课的时候,谈到初始化模型,一般来说会做两个事情,第一个是要选定模型架构,第二个是学会初始化参数。

对于参数这一块,主要是两个,第一个是模型自带的参数,第二个是我们的超参数

模型自带的参数在初始化的时候方式有很多,这个先不谈。超参数的调整一般就是炼丹师口中的调参。

比如说bs,lr,每层节点数,正负样本比例等等,这些其实都属于超参数。

说起调参,其实很多人都会比较头疼,因为这个东西比较吃经验。

之前在知乎收藏了一个问题「你有哪些deep learning(rnn、cnn)调参的经验?」,下面的回答还是挺好的,地址在这里,大家可以去看一下。


地址:https://www.zhihu.com/question/41631631/answer/2859869318


除了这个之外呢,推荐一份谷歌大脑刚出炉的深度学习调参手册,沉淀了他们在深度学习领域的多年“踩坑”经验。这个项目也得到了“深度学习之父” Geoffrey Hinton 的盛赞。

我记得我在B站录制这个仓库解读视频的时候应该是9K,现在去看了下已经14K星标了,增速实在是太快了

它主要分为四个部分。

第一部分这里,关于如何开始一个新的项目

这个部分就是你在开始做一个项目的时候需要优先考虑什么,包括如何选择模型架构,优化器,如何确定bs大小,以及参数初始化需要注意什么问题。

第二个部分,也就是这里,是关于一些改善模型性能的科学方法,比如增量调整策略,你的实验一定是一步步进行迭代的,也就是你的配置需要从简单到复杂,每一轮实验都应该有一个明确的目标等等,还比如如何去选择激活函数和学习率,这一个部分描述的是非常细致的,能看出来都是一些非常好的实战经验。

第三个部分确定每次训练的步骤数,这里其实主要聊的是一个最大训练步数的优化问题。

第四个部分是一些除了前面三个部分一些剩余的经验,比如说如何去评估模型性能,如何选择模型检查点,以及关于Batch normalization 一些实验细节等等。

整体来讲这份文档我自己认为含金量确实比较高,关于一些细节列出一些相关的论文作为延展,我还是很建议大家仔细研读一遍的。

地址在这里:https://github.com/google-research/tuning_playbook


往期精彩回顾




浏览 19
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报