5

图像检索:Oxford Building dataset的问题

 2 years ago
source link: https://yongyuan.name//blog/oxford-and-roxford.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

图像检索:Oxford Building dataset的问题

  • 2019年11月02日
计算机视觉 CV 字数:1021

Oxford Building dataset(后面简称为Oxford)从2007年发布,到2018年Revisiting Oxford and Paris重新整理发布为Revisiting Oxford Building dataset(后面简称为ROxford),整整十年,实例检索(instance retrieval)或物体检索(object retrieval)都跑在一个Ground Truth定义得不是很合理的数据上进行MAP(Mean Average Precision)评估,这期间,虽然有人意识到了Oxford数据集存在的问题,却一直等到10年后,才有人正式的对这个数据集GT定义的合理性给出正面的回应。

Oxford数据集小白菜也一直在用,之所以在实际中验证一些检索算法指标的时候喜欢用这个数据集,是因为这个数据集对小白菜而言,有两个优点:

  • 计算MAP指标比较明晰(具体可以之前写过的关于Oxford MAP的计算过程),方便
  • 数据集规模不大,共5063张图片,验证起来比较快

然后小白菜也这么一直用着,虽然ROxford新定义的GT已经发布了。直到最近,在验证开发的局部特征检索系统在公开数据集上的效果时,一如既往的选择了Oxford的MAP作为衡量指标,发现了针对一些query,其定义的GT存在非常不合理的地方,下面举一个具体的query予以说明。

在Oxford里,all_souls_000013.jpg作为query(见all_souls_1_query.txt)时,包含相同建筑目标的all_souls_000206.jpg被当做跟query不相关的图片,放在了junk里(见all_souls_1_junk.txt)。all_souls_000013.jpgall_souls_000206.jpg对应的图片分别为:

drawing

从上面显示的图片可以看到,all_souls_000206.jpgall_souls_000013.jpg是相关的,它们包含了相同的建筑部分,其对应的匹配结果为:

drawing

显然,all_souls_000206.jpg应归属于good或ok里。这里面还有其他一些不合理的例子,上面列举的只是其中的一个示例。

所以无论是在论文里面或者实际测评实例检索、物体检索算法效果的时候,如果选用了Oxford数据集,最好不要再用老的GT来计算MAP了,而应该采用ROxford里定义的GT。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK