caffe中train过程的train数据集、val数据集、test时候的test数据集区别

val是validation的简称。
training dataset 和 validation dataset都是在训练的时候起作用。
而因为validation的数据集和training没有交集，所以这部分数据对最终训练出的模型没有贡献。
validation的主要作用是来验证是否过拟合、以及用来调节训练参数等。

比如你训练0-10000次迭代过程中，train和validation的loss都是不断降低，
但是从10000-20000过程中train loss不断降低， validation的loss不降反升。
那么就证明继续训练下去，模型只是对training dataset这部分拟合的特别好，但是泛化能力很差。
所以与其选取20000次的结果，不如选择10000次的结果。
这个过程的名字叫做 Early Stop， validation数据在此过程中必不可少。

如果你去跑caffe自带的训练demo，你会用到train_val.prototxt，这里面的val其实就是validation。
而网络输入的TEST层，其实就是validation，而不是test。你可以通过观察validation的loss和train的loss定下你需要的模型。

但是为什么现在很多人都不用validation了呢？
我的理解是现在模型中防止过拟合的机制已经比较完善了，Dropout\BN等做的很好了。
而且很多时候大家都用原来的模型进行fine tune，也比从头开始更难过拟合。
所以大家一般都定一个训练迭代次数，直接取最后的模型来测试。

原文地址：https://www.cnblogs.com/laowangxieboke/p/10417931.html

时间： 2024-11-09 03:42:22

caffe中train过程的train数据集、val数据集、test时候的test数据集区别的相关文章

Caffe中对MNIST执行train操作执行流程解析

之前在 http://blog.csdn.net/fengbingchun/article/details/49849225 中简单介绍过使用Caffe train MNIST的文章,当时只是仿照caffe中的example实现了下,下面说一下执行流程,并精简代码到仅有10余行: 1. 先注册所有层,执行layer_factory.hpp中类LayerRegisterer的构造函数,类LayerRegistry的AddCreator和Registry静态函数:关于Caffe中Lay

Caffe中的优化方法

在Deep Learning中,往往loss function是非凸的,没有解析解,我们需要通过优化方法来求解.Caffe通过协调的进行整个网络的前向传播推倒以及后向梯度对参数进行更新,试图减小损失. Caffe已经封装好了三种优化方法,分别是Stochastic Gradient Descent (SGD), AdaptiveGradient (ADAGRAD), and Nesterov's Accelerated Gradient (NAG). Solver的流程: 1. 设计好需

caffe 中 python 数据层

caffe中大多数层用C++写成. 但是对于自己数据的输入要写对应的输入层,比如你要去图像中的一部分,不能用LMDB,或者你的label 需要特殊的标记. 这时候就需要用python 写一个输入层. 如在fcn 的voc_layers.py 中有两个类: VOCSegDataLayer SBDDSegDataLayer 分别包含:setup,reshape,forward, backward, load_image, load_label. 不需要backward 没有参数更新. import

Caffe中Solver方法(HGL)

Solver就是用来使loss最小化的优化方法,loss是损失函数.损失函数最小的目标就是求解全局最小值. 假设有数据集(X1, X2, -, Xn),对应的(y1, y2, -, yn),其中每个Xi对应m个元素.loss函数定义为其中,F(X)为模型.假设F(X)为线性函数: , x0 = 1 目标:min Φ(θ),loss函数最小.估计最优系数(θ0, θ1, θ2, -, θm). 预备知识:梯度下降法(最速下降法) 顾名思义,梯度下降法的计算过程就是沿梯度下降的方向求解极小值. 具

如何在caffe中添加新的Layer

如何在caffe中添加新的Layer 本文分为两部分,先写一个入门的教程,然后再给出自己添加maxout与NIN的layer的方法 (一) 其实在Github上已经有答案了(https://github.com/BVLC/caffe/issues/684) Here's roughly the process I follow. Add a class declaration for your layer to the appropriate one of common_layers.hpp,

CAFFE中训练与使用阶段网络设计的不同

神经网络中,我们通过最小化神经网络来训练网络,所以在训练时最后一层是损失函数层(LOSS), 在测试时我们通过准确率来评价该网络的优劣,因此最后一层是准确率层(ACCURACY). 但是当我们真正要使用训练好的数据时,我们需要的是网络给我们输入结果,对于分类问题,我们需要获得分类结果,如下右图最后一层我们得到的是概率,我们不需要训练及测试阶段的LOSS,ACCURACY层了. 下图是能过$CAFFE_ROOT/python/draw_net.py绘制$CAFFE_ROOT/models/caf

caffe中权值初始化方法

首先说明:在caffe/include/caffe中的 filer.hpp文件中有它的源文件,如果想看,可以看看哦,反正我是不想看,代码细节吧,现在不想知道太多,有个宏观的idea就可以啦,如果想看代码的具体的话,可以看:http://blog.csdn.net/xizero00/article/details/50921692,写的还是很不错的(不过有的地方的备注不对,不知道改过来了没). 文件 filler.hpp提供了7种权值初始化的方法,分别为:常量初始化(constant).高斯分布初

[转]caffe的配置过程

caffe的配置过程转:http://blog.csdn.net/brightming/article/details/51106629 版权声明:本文为博主原创文章,欢迎转载!转载请写明原文链接出处! 这篇文章可参考:http://www.cnblogs.com/cj695/p/4498270.html 下载caffe拷贝Make.config.example Make.config修改Make.config 取消注释cpu-only,注释掉cuda相关的 -----------------

caffe绘制训练过程的loss和accuracy曲线

转自:http://blog.csdn.net/u013078356/article/details/51154847 在caffe的训练过程中,大家难免想图形化自己的训练数据,以便更好的展示结果.如果自己写代码记录训练过程的数据,那就太麻烦了,caffe中其实已经自带了这样的小工具 caffe-master/tools/extra/parse_log.sh caffe-master/tools/extra/extract_seconds.py和 caffe-master/tools/ext

猜你喜欢

在Centos6.5中配置国内网络yum源以及本地yum源

一.本地yum 1. 创建目录.挂载光盘以及安装createrepo [[email protected] ~]# mkdir/mnt/cdrom ...

3、Spring4之Bean 配置的细节

1). 若字面值中包含特殊字符,则可以使用 value 节点的 <![CDATA[]]> 把字面值包裹起来. <constructor-arg> <!-- 若 value ...

android-基础编程-ViewPager

ViewPager android 提供的基础V4包,android studio 导入gradle compile 'com.android.support:support-v4:25.0.0' 1 ...

监控电量

---恢复内容开始--- 题目: 编写程序,监控手机电量,当电量小于15%的时候进行提示. 监控电池电量的变化,像这种操作特别频繁的广播事件,通过静态注册的方式是无效的. 所以需要对其进行动态注册. ...

android studio环境下创建menu问题（标题栏显示问题）

在创建menu时,在虚拟设备上回显示menu(三个点,如图1),但是在安卓真机上可能会出现不会显示的情况. (图1) 原因是因为安卓系统现在都默认隐藏标题栏,所以menu就不会显示出来. 有两种方法可 ...

Ubuntu下su被拒绝

[email protected]:~$ sudo passwd root输入新的 UNIX 密码: 重新输入新的 UNIX 密码: passwd:已成功更新密码前提是你肯定得知道当前用户的密码. 然 ...

.NET高级群日常一篇

.NET高级群日常(开头聊php,他们可是.NET的顶尖战力之一)太阳神:单从网页的角度来说,两者是类似的老猫子:只要你够牛逼什么语言都不是问题太阳神:PHP的优势在于轻量,劣势在于应用处理能力不足 ...

第2章:我是程序员-回忆大学(一)

大学期间,对于计算机应用基础这门课程,莫言一开始就觉得很是吃力,一开始就是所谓的指法练习,这个莫言就对着书本上的指法慢慢的联系,直到现在,莫言自认为自己的指法还算是比较标准的...那时候,莫言是班上的 ...

Spring AOP--基于XML文件的配置

Spring AOP的配置可以基于注解,也可以基于XML文件.前面几篇都是使用注解的方式.下面介绍下使用XML文件如何配置使用的测试类和切面类都类似.只需要属于AOP的注解去掉即可.下面是AOP的X ...

boost::asio async_write也不能保证一次发完所有数据二

只有看boost源码才能弄明白发生了什么.首先我是将vector里面写入了数据,然后用boost::asio::buffer将vector构造成了mutable_buffer_1对象. 参考该文档的重 ...

STM32F407VG (四)时钟配置

1.STM32 F407VG 的starup_stm32f40_41xxx.s的例如以下位置调用 IMPORT SystemInit,之后调用main函数,所以进入main函数时候就已经自己主动完毕 ...

泛型数组

-----------siwuxie095 在使用泛型方法时,也可以传递或返回一个泛型数组代码: package com.siwuxie095.generic; public class Gen ...

PagedList.MVC 应用

1. NuGet 下载 PagedList.MVC 2. View Page @model PagedList.IPagedList<Libaray.Models.Entities.BookMo ...

Android Service完全解析

Service的基本用法 1.新建一个Android项目,新建一个MyService继承自Service,并重写父类的onCreate(),onStartCommand()方法和onDestory() ...

office快速制作简历

毕业的一年是由学校向社会转变的一年,面临着人生的一个重大转折--找工作.在如今信息爆炸的时代,纵使力拔山兮气盖世也难免会被遗落芳草之中而不得一展宏图.对未来的憧憬,对美好生活的向往,或多或少你需要一份 ...

MangoDB windows安装

MongoDB 下载 MongoDB提供了可用于32位和64位系统的预编译二进制包,你可以从MongoDB官网下载安装,MongoDB预编译二进制包下载地址:http://www.mongodb.or ...

wampserver2.5下载、安装、虚拟主机配置详解

1,下载wampserver2.5 wampserver2.5 64位下载 wampserver2.5 32位下载 2,安装wampserver2.5 一直点击next就可以安装成功了,安装后电脑右下 ...

C#环境下的数值计算库:MathNet

下面用一个简单的例子来说明MathNet的使用方法: 1. 进入MathNet官网找到数值计算库Math.NET Iridium(Numerics)并下载: 2. 将下载的文件解压缩,在目录下的Bin ...

安装部署docker环境

当前环境:centos7 1.参考docker官方文档安装docker:https://docs.docker.com/engine/installation/linux/centos/ [[emai ...

TransactionDefinition接口

16.2.1 探索TransactionDefinition接口正如之前所说的,TransactionDefinition接口控制着事务的属性.下面让我们进一步看看该接口及其方法,如代码清单16-1 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.