参考博文

1.针对 VOC2007和VOC2012 的具体用法

2.Pascal Voc(07+12)联合训练并在07上测试

VOC2007和VOC2012用法

目前广大研究者们普遍使用的是 VOC2007和VOC2012数据集,因为二者是互斥的,不相容的。

论文中针对 VOC2007和VOC2012 的具体用法有以下几种:

1.只用VOC2007的trainval 训练,使用VOC2007的test测试。
2.只用VOC2012的trainval 训练,使用VOC2012的test测试,这种用法很少使用,因为大家都会结合VOC2007使用。
3.(推荐)使用 VOC2007 的 train+val 和 VOC2012的 train+val 训练,然后使用 VOC2007的test测试,这个用法是论文中经常看到的 07+12 ,研究者可以自己测试在VOC2007上的结果,因为VOC2007的test是公开的。
4.使用 VOC2007 的 train+val+test 和 VOC2012的 train+val训练,然后使用 VOC2012的test测试,这个用法是论文中经常看到的 07++12 ,这种方法需提交到VOC官方服务器上评估结果,因为VOC2012 test没有公布。
5.先在 MS COCO 的 trainval 上预训练,再使用 VOC2007 的 train+val、 VOC2012的 train+val 微调训练,然后使用 VOC2007的test测试,这个用法是论文中经常看到的 07+12+COCO 。
6.先在 MS COCO 的 trainval 上预训练,再使用 VOC2007 的 train+val+test 、 VOC2012的 train+val 微调训练,然后使用 VOC2012的test测试 ,这个用法是论文中经常看到的 07++12+COCO,这种方法需提交到VOC官方服务器上评估结果,因为VOC2012 test没有公布。

VOC07+12联合训练并在07上测试

数据分布

对于分类/检测任务而言,完成07 + 12数据集合并后,共得到如下数据:

1
2
3
4
# 5011+11540=16551, 12608+27450=40058
训练数据:16551张图像,共40058个目标
# 全部来自voc07_test
测试数据:4952张图像,共12032个目标

组成如下所示:

训练数据:

1.VOC2007的训练集提供了:

1
2
3
训练数据:2501张图像,共6301个目标
验证数据:2510张图像,共6307个目标
训练+验证数据:5011张图像,共12608个目标

2.VOC2012的训练集提供了:

1
2
3
训练数据:5717张图像,共13609个目标
验证数据:5823张图像,共13841个目标
训练+验证数据:11540张图像,共27450个目标

测试数据:

1.VOC2007的测试集提供了:

1
测试数据:4952张图像,共12032个目标

各种数据集介绍

Pascal VOC

官网地址:Pascal VOC Dataset Mirror (pjreddie.com)

MS COCO

ILSVRC