简单记录一下自己使用caffe的过程和遇到的一些问题。
下载caffe以及安装不详细叙述了, 可参照 http://caffe.berkeleyvision.org/installation.html。
下面准备数据集和训练的过程参照imagenet的过程:可参考 http://drubiano.github.io/2014/06/18/caffe-custom-data.html
1. 将数据集分为train和validate, 分别写到train.txt和val.txt中。 格式每一行文件名+ 空格 + label (label 是从0开始, 并连续)
00001.jpg 0
00002.jpg 1
00004.jpg 1
00003.jpg 2
2. 将准备好的两个txt, 放到caffe_root/data/myfile/ (caffe_root是caffe的根目录, myfile自己命名)。
3. 进入caffe_root/examples/imagenet/ 目录中, 修改create_imagenet.sh
DATA=data/myfile
TRAIN_DATA_ROOT=/img_full_dir1
(img_full_dir1 存放训练图片的目录)
VAL_DATA_ROOT=/img_full_dir2 (img_full_dir2 存放测试图片的目录)
在caffe_root 下执行 ./examples/imagenet/create_imagenet.sh , 可以在examples/imagenet 目录下找到, ilsvrc12_train_lmdb ilsvrc12_val_lmdb两个目录
4. 在caffe_root 下执行 ./examples/imagenet/make_imagenet_mean.sh , 结果保存在data/ilsvrc12/imagenet_mean.binaryproto
5. 修改models/bvlc_reference_caffenet 下的solver.prototxt和 train_val.prototxt, 如果不修改网络的结构, 只需修改图片的大小crop_size <imagewidth。
6. 在caffe_root 下执行 ./examples/imagenet/train_caffenet.sh, 进行训练,训练好的模型放在models/bvlc_reference_caffenet
测试网络及模型
1. 在python下执行, 需要先在根目录下运行 make all
make pycaffe make distribute
2. 将data/ilsvrc12/imagenet_mean.binaryproto 转为numpy格式, 在caffe_root 创建一个mycode的文件夹,创建一个convertmean.py,内容如下:
#!/usr/bin/python import numpy as np import sys sys.path.append('/caffe_root/python')<span style="white-space:pre"> </span>#caffe_root is your caffe root dir need change import caffe if len(sys.argv) != 3: print "Usage: python convert_protomean.py proto.mean out.npy" sys.exit() blob = caffe.proto.caffe_pb2.BlobProto() data = open( sys.argv[1] , 'rb' ).read() blob.ParseFromString(data) arr = np.array( caffe.io.blobproto_to_array(blob) ) out = arr[0] np.save( sys.argv[2] , out )
3. 执行 python convertmean.py /caffe_root/data/ilsvrc12/imagenet_mean.binaryproto mean.npy
4. 将一张图片放到mycode的目录下,vim testcode.py
#!/usr/bin/python import numpy as np caffe_root = '/caffe_root/'<span style="white-space:pre"> </span>#<span style="font-family: Arial, Helvetica, sans-serif;">caffe_root is your caffe root dir need change</span> import sys sys.path.insert(0,caffe_root+'python') import caffe MODEL_FILE = caffe_root + '/models/bvlc_reference_caffenet/deploy.prototxt'<span style="white-space:pre"> </span>#your net PRETRAINED = caffe_root + '/models/bvlc_reference_caffenet/caffenet_train.caffemodel'<span style="white-space:pre"> </span>#your model IMAGE_FILE = caffe_root + 'mycode/imagename.jpg'<span style="white-space:pre"> </span>#your image import os if not os.path.isfile(PRETRAINED): print("Downloading pre-trained CaffeNet model...") caffe.set_mode_cpu() #net = caffe.Classifier(MODEL_FILE, PRETRAINED, # mean=np.load(caffe_root + 'mycode/mean.npy').mean(1).mean(1), # channel_swap=(2,1,0), # raw_scale=255, # image_dims=(256, 256)) net = caffe.Classifier(MODEL_FILE, PRETRAINED) net.set_raw_scale('data',255) net.set_channel_swap('data',(2,1,0)) net.set_mean('data',np.load(caffe_root + 'mycode/mean.npy')) input_image = caffe.io.load_image(IMAGE_FILE) prediction = net.predict([input_image]) print 'prediction shape:', prediction[0].shape print 'predicted class:', prediction[0].argmax()
以上就是整个过程, 仅供参考。 引用了许多网上的代码。