谷歌AI发布稀疏模型高效设计指南!
机器学习算法工程师
共 2923字,需浏览 6分钟
·
2022-03-03 07:45
点蓝色字关注“机器学习算法工程师”
设为星标,干货直达!
本文转自机器之心公众号
编辑:张倩、杜伟
稀疏模型在深度学习领域发挥着越来越重要的作用。对于给定的 token 或样本,它可以只激活模型的一小部分,从而在拥有很大的参数量的同时也能做到计算友好。但是,如何可靠地训练这类模型依然是一个需要解决的问题。在这篇文章中,来自谷歌的 Barret Zoph、Irwan Bello、William Fedus 、Jeff Dean 等研究者给出了一份「高效稀疏专家模型设计指南」。
推荐阅读
辅助模块加速收敛,精度大幅提升!移动端实时的NanoDet-Plus来了!
机器学习算法工程师
一个用心的公众号
评论