【论文笔记】Learning and transferring mid-Level image representations CNN

2019年11月06日

Author: Guofei

文章归类: 0-读论文，文章编号: 5

版权声明：本文作者是郭飞。转载随意，但需要标明原文链接，并通知本人
原文链接：https://www.guofei.site/2019/11/06/transfer_learning_dnn.html

Learning and transferring mid-Level image representations using convolutional neural networks (2014), M. Oquab et al. [pdf]
镜像地址 pdf

abstract&introduction

CNN最近获得了成功，这得益于它能学到大量的 mid-Level image representations

然而，CNN需要巨大的参数量，以及大量的标记图片，限制了CNN在有限训练集上的应用。

这篇论文展示了，可以在一个训练集上训练得到数据，然后 transfer 到其它训练集。

CNN 有 60M parameters，所以往往需要 transfer learning 来训练它

举例来说，你的 source task 是识别不同狗的种类，而 target task 仅需要把狗识别出来。
那么具体做法是，把最后一层softmax层（记为FC8）拿掉，然后加上一层ReLU（FCa）和一层softmax（FCb）

论文实验中用的 source task 的数据源图片是位于中心、背景噪声极低的。而target task 的数据源图片则未必在中心，且背景复杂。

训练时用了上面说的 sliding window detectors ，具体做法是，按不同比例裁剪图片，每个原始图片得到很多样本。
（具体裁剪比例就不摘抄了）

一些细节处理：

这部分是论文主要工作内容，是对各种数据集的验证结果，以及很多细节。最终结论是 transfer learning 是一个挺靠谱的事儿。

这部分就不摘抄了，感兴趣可以看看原文。

您的支持将鼓励我继续创作！