Trustworthy Long-Tailed Classification
【Long-Tailed】【CVPR2022】【paper】【code】
abstract
ds;本文使用多专家模型解决分类长尾问题,使用 D-S 证据理论(DST)构建了针对每个专家输出的置信度,通过 DST 允许多专家模型明确表示“不确定”,从而针对 OOD 数据能够更针对地优化。另外,本文调整专家个数,使其不和类别数目对应(或平均分配)。
overview
contribution
- 使用 DST 构建置信度,第一个在长尾分类声明信度的工作
- 训练时根据信度动态调整不同类别中的专家个数
framework
ds;在文章中,类别总共有 $K$ 个。
ds;整体来说,训练时除了输出概率 $\mathcal S_K=\{p|\sum_{k=1}^{K}p_k=1,\ 0\le p_k\le1,\ \forall k\}$ 之外,还将原本的 softmax 层替换为 relu,即可得到一系列初始信度 $\mathbf{e}=\{e_i\}_{i=1}^K$,使用 $\mathbf{e}$ 进行狄利克雷分布建模可得:
ds;其中,$\mathbf{\alpha}=\mathbf{e+1}$,$B(\cdot)$ 为 beta 函数,