Caffe

Convolutional Architecture for Fast Feature Embedding是贾扬清写的一个深度学习框架。

注：贾扬清，清华的本硕（2009）+UCB的博士（2014）。先后在Google和Facebook任研究员。知乎名人。
个人主页：
http://daggerfs.com/

http://caffe.berkeleyvision.org/

https://github.com/BVLC/caffe

http://caffe.berkeleyvision.org/doxygen/index.html

Ubuntu 17.04以后：

sudo apt install caffe-cpu

sudo apt install caffe-cuda

不过由于DL进展比较快，自定义Layer的需求也是相当广泛，因此有必要掌握源代码编译的方法。

sudo apt install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler

sudo apt install --no-install-recommends libboost-all-dev

虽然Caffe支持CMake Build，但是定制化没有Make Build方便，所以我选择后者。

cp Makefile.config.example Makefile.config
make all -j 8
make test -j 8
make runtest -j 8

这里会遇到fatal error: hdf5.h的问题，解决办法：

Makefile.config文件的第90行：

INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include

INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/include/hdf5/serial/

Makefile文件的第180行：

LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_hl hdf5

LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_serial_hl hdf5_serial

pycaffe

make pycaffe

export PYTHONPATH=/path/to/caffe/python:$PYTHONPATH

import caffe

Caffe有两种运行方式：

1.编程式。这种模式也是TensorFlow采用的方式，即直接在main函数中调用Caffe函数。

examples/cpp_classification/classification.cpp

2.命令行式。这种模式适合于流程比较简单的情况。使用caffe工具加载模板文件进行训练或预测。

examples/mnist/train_lenet.sh

照例，还是MNIST。

cd $CAFFE_ROOT
./data/mnist/get_mnist.sh
./examples/mnist/create_mnist.sh
./examples/mnist/train_lenet.sh

默认使用GPU，如果要用CPU的话，可修改lenet_solver.prototxt：

solver_mode: CPU

prototxt：模板文件。定义NN中的层之类的结构。

从阅读习惯上，我们浏览一个NN结构，通常是从input到output。prototxt文件的组织也采用了这样的顺序。然而和通常描述上下访问关系的顺序（从上到下）不同，Caffe认为input在最底部，所以input结点只有top属性。

复杂网络的prototxt往往不止一个：

1.Solver。用于设置训练时的参数。

2.Train。用于描述训练时的网络结构。

3.Deploy。用于描述部署时的网络结构。

caffemodel：模型文件。训练好的模型可以放在模型文件中，以便于今后的预测。模型文件采用protobuf格式保存。其结构由模板文件负责描述。

除了模板文件和模型文件之外，有的时候训练样本也需要打包存储成dataset文件，以防止小文件过多导致的IO速度问题。

Caffe生成的dataset文件分为2种格式：Lmdb和Leveldb。它们都是键/值对（Key/Value Pair）嵌入式数据库管理系统编程库。

http://www.cnblogs.com/yymn/p/4479216.html

Caffe1——Mnist数据集创建lmdb或leveldb类型的数据

https://github.com/BVLC/caffe/wiki/Model-Zoo

Caffe官网上有个Model Zoo，可从中获得一些经典模型的模板文件和模型文件。

https://github.com/soeaver/caffe-model

另一个网友版Model Zoo

http://www.cnblogs.com/hansjorn/p/4816059.html

Caffe模型读取

https://github.com/shicai/Caffe_Manual

Caffe使用教程

https://www.zhihu.com/question/37082410

用c++怎么去调用你训练好的caffe模型啊？

http://www.cnblogs.com/denny402/p/5111018.html

用训练好的caffemodel来进行分类

prototxt文件的可视化

1.使用在线工具netscope。

https://ethereon.github.io/netscope/quickstart.html

2.使用自带draw_net.py脚本。

http://www.cnblogs.com/zjutzz/p/5955218.html

caffe绘制网络结构图

http://yanglei.me/gen_proto/

另一个在线工具。

Caffe中用于数据操作和交换的数据结构。简单来说，就是一个4维数组，格式如下表所示：

Name	tensor format	channel order	format
Caffe	number,channel,height,width	BGR	BBBGGGRRR
TensorFlow	number,height,width,channel	RGB	RGBRGBRGB
Darknet	number,channel,height,width	RGB	RRRGGGBBB
OpenVX	width,height,channel,number
OpenCV	height,width,channel	BGR
PIL	height,width,channel	RGB

注：在API层面，Caffe和OpenVX顺序完全相反，但是由于OpenVX是列优先存储，因此在内存存储方面，两者的格式正好完全一致。详见《多维数组的行优先和列优先》一节。

lr_mult

学习率因子。基数是solver在运行时采用的学习率。

decay_mult

衰减因子。基数含义同上。

lr_mult参数和decay_mult参数的存在，允许不同的层有不同的学习率或衰减率。

在一个卷积层中，通常会有2组lr_mult参数和decay_mult参数，其中前一组是weight参数的学习率或衰减率，而后一组是bias参数的。

param {
    lr_mult: 1
    decay_mult: 1
}
param {
    lr_mult: 2
    decay_mult: 0
}

上面这组参数被实践证明，是比较work的参数。

flatten

将n * c * h * w的blob，转换成n * (c * h * w)的结构。

Crop层的输入（bottom blobs）有两个，让我们假设为A和B，输出（top）为C。

A：要进行裁切的bottom。

B：裁切的参考输入。

参数：axis=1，offset=（25,128,128）

C：C = A[: , 25: 25+B.shape[1] , 128: 128+B.shape[2] , 128: 128+B.shape[3] ]

crop在tensorflow中可用strided_slice实现。

http://www.cnblogs.com/MrLJC/p/6843626.html

tf.strided_slice用法

slice

layer {
  name: "data_each"
  type: "Slice"
  bottom: "data_all"
  top: "data_classfier"
  top: "data_boundingbox"
  top: "data_facialpoints"
  slice_param {
    axis: 0
    slice_point: 150
    slice_point: 200
  }
}

其中slice_point的个数必须等于top的个数减一。输入的data_all维度为(250×3×24×24)，拆分后的3个输出的维度依次为(150×3×24×24),(50×3×24×24),(50×3×24×24)。

Caffe的代码相对比较简单，符合个人作品的特点。

Caffe没有计算图的概念，所有操作都聚焦于NN本身，对于实际业务的支持有限。其结构主要针对CNN进行设计，通用性无法和TensorFlow相比。但相对简单的结构，非常适合CV用途，成为了目前CV DL的事实标准。

Caffe的代码有相当一部分是由.proto文件自动生成的，最著名的当属LayerParameter。因此如果在C++代码中找不到相关实现的话，不妨到.proto文件中碰碰运气。

例如Conv的实现在src/caffe/layers/conv_layer.cpp中。

Conv Backprop

src/caffe/layers/conv_layer.cpp: ConvolutionLayer::Backward_cpu
src/caffe/layers/base_conv_layer.cpp: BaseConvolutionLayer::weight_cpu_gemm
src/caffe/util/math_functions.cpp: caffe_cpu_gemm
cblas_sgemm

Ristretto Caffe

Ristretto Caffe是一个caffe扩展，支持fp16和int8等特殊格式的数据的转换和运算。

http://lepsucd.com/?page_id=621

https://github.com/pmgysel/caffe

Caffe-MPI

Caffe-MPI是一款高性能高可扩展的深度学习计算框架，由浪潮的HPC应用开发团队进行开发。

https://github.com/Caffe-MPI/Caffe-MPI.github.io

https://mp.weixin.qq.com/s/n9b0Mf2ikBDxXgknEBTrTg

浪潮集团副总裁胡雷钧：扩展Caffe，从方案、框架、系统、平台应对AI计算挑战

Caffe由于主要应用于图像处理领域，其对于RNN的支持实际上是不太优雅的。

RNN在计算方面的难点在于：整个计算图不再是DAG了，有计算环的存在。Caffe采用按时序展开RNN的方式，将有环的计算图展开为DAG。

Caffe的LSTM实现主要包含三个层次：

1.RecurrentLayer。这个类定义了处理时间序列的循环神经网络的通用行为。RNNLayer和LSTMLayer都是它的子类。

2.LSTMLayer。

3.LSTMUnitLayer。LSTM的核心计算部分。

下图中的方框表示了各自Layer所包含的运算。

http://www.meltycriss.com/2016/07/13/caffe_2_rnn/

Caffe学习：RNN源码阅读

http://www.meltycriss.com/2016/08/05/caffe_4_lstm/

Caffe学习：LSTM源码阅读

http://blog.csdn.net/mounty_fsc/article/details/53114698

（Caffe）LSTM层分析

https://mp.weixin.qq.com/s/-Jn4UbZ6EqRYceJqI1l16g

一文简短介绍Caffe

http://blog.csdn.net/haluoluo211/article/details/77918156

caffe python图片训练识别实例

https://mp.weixin.qq.com/s/XxPsbTSiE1M4hIoH0bg0lA

caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现

Caffe2

2017.4，贾扬清推出了全新设计的Caffe2。由于是全新设计，Caffe2和Caffe不兼容，完全可看为是一个新的DL框架。

https://caffe2.ai/

2018.4，Caffe2的框架代码与PyTorch合并。Caffe2将主要应用于客户端的推理过程。

感觉Caffe2属于典型的昙花一现，虽然借助Caffe的影响力，立了一个山头，但FaceBook终究精力有限，能支撑一个不被Google打倒的框架已经是颇不容易了，两个根本别想！

https://mp.weixin.qq.com/s/YYwmRwq5TN7JPah_arNyaQ

Facebook开源产业级深度学习框架Caffe2

darknet

darknet代码：

https://github.com/pjreddie/darknet/

有个叫做darkflow的项目，可以用于将darknet模型转换成tensorflow模型：

https://github.com/thtrieu/darkflow

Conv Backprop

src/convolutional_layer.c: backward_convolutional_layer
src/gemm.c: gemm

Caffe, darknet

Caffe

pycaffe

prototxt文件的可视化

lr_mult

decay_mult

flatten

slice

Conv Backprop

Ristretto Caffe

Caffe-MPI

Caffe2

darknet

Conv Backprop

Recommend

Machine Learning之Python篇（一）

OpenVX, 运算加速库, 线性代数库

TensorFlow（二）

Machine Learning之Java篇

TensorFlow（三）

Pytorch（一）

Machine Learning之Python篇（二）

【IDC圈一周最HOT】深圳、安徽政策，IDC牌照，移动成渝江南数据中心建设，“算力基础设...

NLP（二）, Storm

Everything I learned about technical debt

About Joyk