使用caffe训练mnist数据集 - caffe教程实战（一）

个人认为学习一个陌生的框架，最好从例子开始，所以我们也从一个例子开始。

学习本教程之前，你需要首先对卷积神经网络算法原理有些了解，而且安装好了caffe

卷积神经网络原理参考：http://cs231n.stanford.edu/syllabus.html

Ubuntu安装caffe教程参考：http://caffe.berkeleyvision.org/install_apt.html

先讲解一下caffe设计的架构吧：

训练mnist数据集使用 build/tools/caffe

训练步骤：

准备数据：

cd $CAFFE_ROOT   //安装caffe的根目录

./data/mnist/get_mnist.sh  //下载mnist数据集

./examples/mnist/create_mnist.sh   //将图片转为lmdb数据格式

定义网络模型：

　　首先定义数据层：　

　　layer {
  　　name: "mnist"  //名字可以随便写 字符串类型
  　　type: "Data"　　//类型 必须是 Data 字符串类型
  　　transform_param {
    　　scale: 0.00390625
  　　}
  　　data_param {
    　　source: "mnist_train_lmdb"
    　　backend: LMDB
    　　batch_size: 64
  　　}
  　　top: "data"
  　　top: "label"
　　}

　　定义卷基层：

　　layer {
  　　name: "conv1"
  　　type: "Convolution"
  　　param { lr_mult: 1 } #定义w参数的学习率
  　　param { lr_mult: 2 } #定义b参数的学习率
  　　convolution_param {
    　　num_output: 20    #定义输出map数量
    　　kernel_size: 5
    　　stride: 1
    　　weight_filler {
      　　type: "xavier"
    　　}
    　　bias_filler {
      　　type: "constant"
    　　}
  　　}
  　　bottom: "data"
  　　top: "conv1"
　　}定义pool层：

　　layer {
  　　name: "pool1"
  　　type: "Pooling"
 　　 pooling_param {
    　　kernel_size: 2
   　　 stride: 2
   　　 pool: MAX
 　　 }
  　　bottom: "conv1"
  　　top: "pool1"
　　} 定义全连接层：

　　layer {
　　  name: "ip1"
 　　 type: "InnerProduct"
 　　 param { lr_mult: 1 }
 　　 param { lr_mult: 2 }
  　　inner_product_param {
   　　 num_output: 500
   　　 weight_filler {
     　　 type: "xavier"
   　　 }
   　　 bias_filler {
   　　   type: "constant"
   　　 }
 　　 }
 　　 bottom: "pool2"
 　　 top: "ip1"
　　}　　定义relu层：

　　layer {
　　  name: "relu1"
　　  type: "ReLU"
 　　 bottom: "ip1"
 　　 top: "ip1"
　　}  再定义一个全连接层： 注意这里的输出为 分类的个数　　layer {

　　  name: "ip2"
  　　type: "InnerProduct"
 　　 param { lr_mult: 1 }
  　　param { lr_mult: 2 }
  　　inner_product_param {
   　　 num_output: 10    #表示有10个类别 从0-9个数字
   　　 weight_filler {
      　　type: "xavier"
   　　 }
    　　bias_filler {
    　　  type: "constant"
   　　 }
 　　 }
  　　bottom: "ip1"
  　　top: "ip2"
　　}

　　最后定义 损失函数

　　layer {
 　　 name: "loss"
  　　type: "SoftmaxWithLoss"
  　　bottom: "ip2"
 　　 bottom: "label"
　　}定义好网络模型后，需要定义 模型训练的策略， solver

# The train/test net protocol buffer definition
net: "examples/mnist/lenet_train_test.prototxt"
# test_iter specifies how many forward passes the test should carry out.
# In the case of MNIST, we have test batch size 100 and 100 test iterations,
# covering the full 10,000 testing images.
test_iter: 100
# Carry out testing every 500 training iterations.
test_interval: 500
# The base learning rate, momentum and the weight decay of the network.
base_lr: 0.01
momentum: 0.9
weight_decay: 0.0005
# The learning rate policy
lr_policy: "inv"
gamma: 0.0001
power: 0.75
# Display every 100 iterations
display: 100
# The maximum number of iterations
max_iter: 10000
# snapshot intermediate results
snapshot: 5000
snapshot_prefix: "examples/mnist/lenet"
# solver mode: CPU or GPU
solver_mode: GPU  #使用gpu进行训练

开始训练网络：

cd $CAFFE_ROOT
./examples/mnist/train_lenet.sh

你会看到类似下面的输出：

I1203 net.cpp:66] Creating Layer conv1
I1203 net.cpp:76] conv1 <- data
I1203 net.cpp:101] conv1 -> conv1
I1203 net.cpp:116] Top shape: 20 24 24
I1203 net.cpp:127] conv1 needs backward computation.。。。。。

I1203 net.cpp:142] Network initialization done.
I1203 solver.cpp:36] Solver scaffolding done.
I1203 solver.cpp:44] Solving LeNet。。。。。

I1203 solver.cpp:84] Testing net
I1203 solver.cpp:111] Test score #0: 0.9897
I1203 solver.cpp:111] Test score #1: 0.0324599
I1203 solver.cpp:126] Snapshotting to lenet_iter_10000
I1203 solver.cpp:133] Snapshotting solver state to lenet_iter_10000.solverstate
I1203 solver.cpp:78] Optimization Done.结束

运行结构图：

接下来的教程会结合源码详细展开这三部做了什么看懂caffe源码

欢迎加入深度学习交流群，群号码：317703095

时间： 2024-10-02 03:56:53

使用caffe训练mnist数据集 - caffe教程实战（一）的相关文章

TensorFlow训练MNIST数据集（3） —— 卷积神经网络

前面两篇随笔实现的单层神经网络和多层神经网络, 在MNIST测试集上的正确率分别约为90%和96%.在换用多层神经网络后,正确率已有很大的提升.这次将采用卷积神经网络继续进行测试. 1.模型基本结构如下图所示,本次采用的模型共有8层(包含dropout层).其中卷积层和池化层各有两层. 在整个模型中,输入层负责数据输入:卷积层负责提取图片的特征:池化层采用最大池化的方式,突出主要特征,并减少参数维度:全连接层再将个特征组合起来:dropout层可以减少每次训练的计算量,并可以一定程度上避免过

caffe在windows编译工程及运行mnist数据集测试

caffe在windows上的配置和编译可以参考如下的博客: http://blog.csdn.net/joshua_1988/article/details/45036993 http://blog.csdn.net/joshua_1988/article/details/45048871 http://blog.csdn.net/dongb5lz/article/details/45171187 http://m.blog.csdn.net/blog/thesby/43535619 按照上面

Ubuntu14.04+caffe+cuda7.5 环境搭建以及MNIST数据集的训练与测试

Ubuntu14.04+caffe+cuda 环境搭建以及MNIST数据集的训练与测试一.ubuntu14.04的安装: ubuntu的安装是一件十分简单的事情,这里给出一个参考教程: http://jingyan.baidu.com/article/76a7e409bea83efc3b6e1507.html 二.cuda的安装: 1.首先下载nvidia cuda的仓库安装包(我的是ubuntu 14.04 64位,所以下载的是ubuntu14.04的安装包,如果你是32位的可以参看具体的地

CAFFE学习笔记（一）Caffe_Example之训练mnist

0.参考文献 [1]caffe官网<Training LeNet on MNIST with Caffe>; [2]薛开宇<读书笔记4学习搭建自己的网络MNIST在caffe上进行训练与学习>([1]的翻译版,同时还有作者的一些注解,很赞); 1.*.sh文件如何执行? ①方法一:有sh后缀名的是linux脚本文件,在windows下为了执行这个文件,应该下载Git.然后对于sh文件右键,打开方式,选择git-bash.exe. ②方法二:直接将后缀名改成“bat”然后双击. 2.

从零到一：caffe-windows(CPU)配置与利用mnist数据集训练第一个caffemodel

一.前言本文会详细地阐述caffe-windows的配置教程.由于博主自己也只是个在校学生,目前也写不了太深入的东西,所以准备从最基础的开始一步步来.个人的计划是分成配置和运行官方教程,利用自己的数据集进行训练和利用caffe来实现别人论文中的模型(目前在尝试的是轻量级的SqueezeNet)三步走.不求深度,但求详细.因为说实话caffe-windows的配置当初花了挺多时间的,目前貌似还真没有从头开始一步步讲起的教程,所以博主就争取试着每一步都讲清楚吧. 这里说些题外话:之所以选择Sque

Caffe 深度学习框架上手教程

本文来源:http://suanfazu.com/t/caffe/281 本文的主要目的保存一个链接,建议阅读原文. Caffe(Convolutional Architecture for Fast Feature Embedding)是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的贾扬清,目前在Google工作. Caffe是纯粹的C++/CUDA架构,支持命令行.Python和MATLAB接口:可以在CPU和GPU直接无缝切换: Caffe::set_mode(

利用GPU和Caffe训练神经网络

利用GPU和Caffe训练神经网络摘要:本文为利用GPU和Caffe训练神经网络的实战教程,介绍了根据Kaggle的“奥托集团产品分类挑战赛”的数据进行训练一种多层前馈网络模型的方法,如何将模型应用于新数据,以及如何将网络图和训练权值可视化. [编者按]本文为利用GPU和Caffe训练神经网络的实战教程,介绍了根据Kaggle的“奥托集团产品分类挑战赛”的数据进行训练一种多层前馈网络模型的方法,如何将模型应用于新数据,以及如何将网络图和训练权值可视化. Caffe是由贾扬清发起的一个开源深度学

caffe框架下目标检测——faster-rcnn实战篇操作

原有模型 1.下载fasrer-rcnn源代码并安装 git clone --recursive https://github.com/rbgirshick/py-faster-rcnn.git 1) 经常断的话,可以采取两步: git clone https://github.com/rbgirshick/py-faster-rcnn.git 2) 到py-faster-rcnn中,继续下载caffe-faster-rcnn,采取后台跑: git submodule update --in

caffe的学习和使用·一」--使用caffe训练自己的数据

学习知识的一种方式是先会用然后再问为什么. 在安装完成caffe,根据caffe的提示下载完mnist训练测试数据,并且运行lenet训练模型之后,摆在眼前的问题就是我怎么用caffe训练自己的数据啊,mnist的数据通过脚本就可以下载创建成lmdb,我要训练自己的数据集该怎么做? 用caffe训练自己的数据,必须解决的问题有两个:1.如何输入数据, 2.如何定义输出首先我们解决第一个问题:训练数据的输入,这里我们之介绍使用lmdb的方式查看lenet的train_val.prototxt,