CVPR 2022 Oral | 回归标签不平衡? 试试Balanced MSE

极市平台

共 3070字,需浏览 7分钟

 ·

2022-05-20 05:45

↑ 点击蓝字 关注极市平台

作者丨任嘉玮
来源丨商汤学术
编辑丨极市平台

极市导读

 

本文针对不平衡回归的问题设定,从统计的视角下重新思考了常用的MSE损失函数,发现MSE会受到不平衡标签分布的影响而做出不准确的预测。为解决这个问题,作者提出了Balanced MSE损失函数,并给出了灵活的实现形式,包括不需要预先计算标签分布的实现。Balanced MSE在一维与多维的不平衡回归问题上都超过了最好的现有方法。>>加入极市CV技术交流群,走在计算机视觉的最前沿

在CVPR 2022上,商汤科技-南洋理工大学联合AI研究中心S-Lab与新加坡国立大学的研究者针对不平衡回归问题提出Balanced MSE损失函数。

标签不平衡经常出现在现实世界中的视觉回归问题中,而常用的MSE损失函数在预测少见标签时往往会产生很大的误差。Balanced MSE从统计的视角解决标签的不平衡,同时适用于一维与多维回归;其具有简单、灵活的实现形式,不需要提前对标签分布进行计算也可以轻松接入训练中。

论文名称:Balanced MSE for Imbalanced Visual Regression

论文地址http://arxiv.org/pdf/2203.16427

项目地址https://sites.google.com/view/balanced-mse/home

源码地址https://github.com/jiawei-ren/BalancedMSE

Balanced MSE的相关代码目前已经开源,欢迎各位同学使用和交流。

问题和挑战

标签的不平衡是现实世界中视觉回归里常见的问题,例如在年龄回归问题中,可能大部分训练样本都来自于成年人,老人与儿童的训练样本则相对较少。

常用的Mean Square Error (MSE) 损失函数在少见样本上的表现往往不尽如人意,因此越来越多的研究开始重视不平衡回归,大规模评测集也在最近被提出[1]。相比于已经被广泛研究的不平衡分类,针对不平衡回归的研究工作相对较少。较早的研究试图通过生成的方法来增加少见标签的训练样本[2],但样本生成在面对图像等高维数据时可行性较低。

最近的研究主要采用重加权来提高少见标签在训练集中的权重[1],但重加权在不平衡分类中已被证明效果有限[3],我们也通过实验在不平衡回归上验证了这一点。因此,不平衡回归问题还处于一个起步阶段,目前依然缺少行之有效的方法。

图1 不平衡回归示例

方法介绍

为了填补不平衡回归方法的空白,我们提出了Balanced MSE损失函数,从统计的视角解决标签的不平衡。

1. 重新思考MSE损失函数

我们首先重新审视了常用的MSE损失函数,发现当训练数据不平衡时,MSE会被标签分布所影响而倾向于预测常见的标签。当测试集是平衡的或衡量指标是平衡的时候,MSE的这一特点会导致模型在整体标签上的平均表现变差。我们沿着这个思路,使用概率的方法摆脱了不平衡的标签分布对MSE的影响。我们将改进后的损失函数称作Balanced MSE。

图2 统计视角下的MSE与Balanced MSE

2. 统一视角下的不平衡分类与回归

其实从统计的视角解决标签不平衡的思路在不平衡分类中也被深入讨论过,其中我们在NeurIPS 2020的工作Balanced Softmax [4]在长尾视觉分类上带来了显著的性能提升。然而由于MSE损失函数的概率意义很少被提及,这个思路在不平衡回归问题上是首次被探讨。

不仅如此,我们也通过我们的两篇工作,Balanced Softmax与Balanced MSE,第一次将不平衡分类与不平衡回归融入了统一的框架中讨论。未来更多的不平衡分类技巧也可通过这个框架被引入不平衡回归的领域中。

3. 灵活的实现

我们为Balanced MSE中关于标签分布的积分计算提供了灵活的实现方式。我们提出的实现中既可以使用传统的分段标签分布,也可以使用使用高斯混合模型拟合的标签分布,甚至可以不依赖任何预先处理的标签分布。

这里我们着重介绍不依赖预处理标签分布的实现方式,我们称为BMC。BMC从每个训练batch中估计标签分布信息,因此不需要进行任何额外的操作即可替换常用的MSE损失函数。

BMC的形式也十分有趣,可以等价于将训练batch中对每个标签看作类别进行分类。其中,分类的logit由标签与预测之间的L2距离获得,非常类似自监督学习中使用的contrastive loss。得益于此,BMC可以简单地通过分类中的的交叉熵损失函数快速实现。

图3 Balanced MSE的BMC形式不依赖标签分布,可以通过几行代码快速实现

实验结果

我们在首先使用合成数据集对Balanced MSE进行了实验。图4 展示了Balanced MSE在不同的标签分布下都能得到最接近真实线性关系的结果,而重加权方法的表现则随着标签分布越来越不平衡变得越来越差。

图4 Balanced MSE在不同标签分布下的一维不平衡回归

图5和图6分别展示了Balanced MSE在多维不平衡回归与非线性不平衡回归中依然能取得当前最好的表现。

图5 Balanced MSE适用于多维不平衡回归
图6 Balanced MSE适用于一维非线性回归

除此之外,我们在三个真实数据集上验证了Balanced MSE的效果,其中包括包含两个一维不平衡回归问题:年龄回归与深度回归,以及一个我们提出的多维不平衡回归问题:人体mesh估计[5]。

我们的方法均显著超过了当前的最优算法。图7中可以看到Balanced MSE显著提升了对儿童和老人等少数群体的年龄估计表现。图8显示Balanced MSE可以有效估计少见的姿态,能够帮助恢复出完整的动作幅度。

图7 Balanced MSE在不平衡年龄回归数据集上取得的表现提升
图8 在人体mesh估计上表现对比,左边为基线,右边为Balanced MSE

结语

我们针对不平衡回归的问题设定,从统计的视角下重新思考了常用的MSE损失函数,发现MSE会受到不平衡标签分布的影响而做出不准确的预测。为解决这个问题,我们提出了Balanced MSE损失函数,并给出了灵活的实现形式,包括不需要预先计算标签分布的实现。

Balanced MSE在一维与多维的不平衡回归问题上都超过了最好的现有方法。结合我们之前的工作Balanced Softmax,我们为不平衡分类与回归提供了一个统一的视角,希望更多的不平衡分类技巧可以借此引入不平衡回归问题中。

作者信息

任嘉玮 | 南洋理工大学S-Lab一年级博士生,导师是Ziwei Liu助理教授,以一作身份发表三篇顶会论文,曾获得COCO 2019 全景分割挑战冠军。目前研究兴趣是不平衡学习、3D表征学习和数字人。

公众号后台回复“CVPR 2022”获取论文合集打包下载~

△点击卡片关注极市平台,获取最新CV干货
极市干货
数据集资源汇总:90+深度学习开源数据集整理|包括目标检测、工业缺陷、图像分割等多个方向
CVPR 2022:CVPR'22 最新132篇论文分方向整理CVPR'22 最新106篇论文分方向整理一文看尽 CVPR 2022 最新 20 篇 Oral 论文
极市动态:光大环保与极视角正式开启厂区智慧安防项目合作!极视角成为首批「青岛市人工智能产业链链主企业」!
最新竞赛:六大真实场景赛题!ECV2022极市计算机视觉开发者榜单大赛预报名开启


觉得有用麻烦给个在看啦~  

浏览 49
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报