BiFPN
共 2420字,需浏览 5分钟
·
2021-03-18 20:19
EfficientDet是谷歌团队推出的目标检测网络,论文链接:https://arxiv.org/abs/1911.09070
只使用了 52M 参数、326B FLOPS 的 EfficientDet-D7 在 COCO 数据集上实现了当前最优的 51.0 mAP
在类似的准确率限制下,EfficientDet 的 FLOPS 仅为 YOLOv3 的 1/28、RetinaNet 的 1/30、NASFPN 的 1/19。
detector 由三部分组成:
• Backbone: EfficientNet
• feature network: BiFPN network
• box/class prediction network
• 作者研究的两个出发点是:寻求高效的多尺度特征融合方式 (efficient multi-scale feature fusion) 和模型扩展方式 (model scaling) 。
BiFPN
• FPN 引入了一条自顶向下的通道来融合特征;
• PANet 在 FPN 基础上增加了一条自底向上的通道;
• NAS-FPN 使用了搜索出来的不规则的拓扑结构。 https://arxiv.org/abs/1904.07392
在搜索过程中,研究者的目标是发现具有相同输入和输出特征级别并且可以被重复应用的微粒架构。模块化搜索空间使得搜索金字塔架构变得易于管理。
• 一般的做法是:不同 resolution 的特征融合时直接相加,但实际上它们对最后 output 的贡献是不同的,所以作者希望网络来学习不同输入特征的权重,即 weighted feature fusion。
PANet比FPN和NAS-FPN具有更好的精度,但需要花费更多的参数和计算。
• 全连接的 FPN
• PANet 的一种简化版,去除掉只有一条输入 边 和输出边 的 结点
• BiFPN ,在 PANet 简化版的基础上,若输入和输出结点是同一 level 的,则添加一条额外的边,在不增加 cost 的同时融合更多的特征。(注意, PANet 只有一条 top-down path 和一条 bottom-up path ,而本文作者是将 BiFPN 当作一个 feature network layer 来用的,重复堆叠它们来获得更高级的特征融合方式)
weight的三种讨论
• 实验表明, unbounded fusion 效果是不错的, softmax -based fusion 效果最好但是计算资源消耗过大, fast normalized fusion 精度与 softmax -based fusion 相似但可以快 30% 。所以作者最终采用了 fast normalized fusion 方式。