ViTに優った！大規模CNNの新たな基盤モデル！: InternImage （）

3つの要点 ?? Deformable Convolutionを核としたCNNモデルが分類・検出・セグメンテーションでViTと同等以上の精度を達成！ ?? 物体検出・セグメンテーションでは堂々の1位を達成！ ?? DCNv2を改良したDCNv3により3×3カーネルの少ないパラメータで受容野を拡大！ InternImage: Exploring Large-Scale V…

TechMedia

ViTに優った！大規模CNNの新たな基盤モデル！: InternImage （）

Related

Archives