目标检测faster rcnn error == cudaSuccess (2 vs. 0) out of memory

想尝试 更深更强的网络,或者自己写了一个费显存的层,发现1080 ti的11G显存不够用了,老师报显存不够怎么办?

Check failed: error == cudaSuccess (2 vs. 0)  out of memory

调小batch_size的大小。

怎么调呢?

调这个文件:

experiments/cfgs/faster_rcnn_end2end.yml

EXP_DIR: faster_rcnn_end2end
TRAIN:
HAS_RPN: True
IMS_PER_BATCH: 1
BBOX_NORMALIZE_TARGETS_PRECOMPUTED: True
RPN_POSITIVE_OVERLAP: 0.7
#RPN_BATCHSIZE: 256
RPN_BATCHSIZE: 160
PROPOSAL_METHOD: gt
BG_THRESH_LO: 0.0
#BATCH_SIZE: 64
BATCH_SIZE: 32
#RPN_POST_NMS_TOP_N: 700
RPN_POST_NMS_TOP_N: 500
USE_OHEM: True
ASPECT_GROUPING: False
TEST:
HAS_RPN: True

当然,写代码的方式也可以。比如说写一个batch_norm层,来归一化参数。让每一层的参数没那么凌乱。不过这个减少的显存还是比较小的。

原文地址:https://www.cnblogs.com/whu-zeng/p/9189368.html

时间: 2024-11-05 13:39:40

目标检测faster rcnn error == cudaSuccess (2 vs. 0) out of memory的相关文章

Check failed: error == cudaSuccess (10 vs. 0) invalid device ordinal

ubuntu14.04 caffe 运行别人的程序,报错Check failed: error == cudaSuccess (10 vs. 0)  invalid device ordinal.根据网上的说法,GPU内存不够,可是batch大小改为1了还是不行.问了博士师兄才发现,在该行上面有一行,写着using GPUs 1.而我只有一个GPU,如图2,我把solver_48.prototxt中最后一行的device_id改为0,接着运行,见图1,这个错误就没有啦--当然我的又报了别的错..

caffe运行错误: im2col.cu:61] Check failed: error == cudaSuccess (8 vs. 0) invalid device function

错误: im2col.cu:61] Check failed: error == cudaSuccess (8 vs. 0)  invalid device function 原因:由于Makefile.config里面只对cuda8.0一下的架构编译cuda程序,所以采用cuda8.0后cuda程序没有被编译 解决:修改Makefile.config中的 CUDA_ARCH 添加 -gencode arch=compute_61,code=sm_61 计算能力可以参考下面链接添加合适的架构参数

caffe 训练时,出现错误:Check failed: error == cudaSuccess (4 vs. 0) unspecified launch failure

I0415 15:03:37.603461 27311 solver.cpp:42] Solver scaffolding done.I0415 15:03:37.603549 27311 solver.cpp:247] Solving AlexNetI0415 15:03:37.603559 27311 solver.cpp:248] Learning Rate Policy: stepI0415 15:03:37.749981 27311 solver.cpp:214] Iteration

paper 111:图像分类物体目标检测 from RCNN to YOLO

参考列表 Selective Search for Object Recognition Selective Search for Object Recognition(菜菜鸟小Q的专栏) Selective Search for Object Recognition(Surge) Selective Search for Object Recognition(原始论文) Efficient Graph-Based Image Segmentation(快速图像分割) Homepage of K

Run Caffe Meet [Check failed: error == cudaSuccess (8 vs.0) invalid device function]

It is possible relative to CUDA compute cabality , and should find your VGA Driver's compute cabality You can refer to is Blog: http://blog.csdn.net/real_myth/article/details/44308169 And then edit [CUDA_ARCH] in your Makefile.config, for examples, m

R-CNN系列目标检测博文汇总

R-CNN [深度学习]R-CNN 论文解读及个人理解 [目标检测]RCNN算法详解 R-CNN论文翻译解读 总之,R-CNN取得成功的两个关键因素:1:在候选区域上自下而上使用大型卷积神经网络(CNNs),用以定位和分割物体.2:当带标签的训练数据不足时,先针对辅助任务进行有监督预训练,再进行特定任务的调优,就可以产生明显的性能提升 简单来说,RCNN使用以下四步实现目标检测: a. 在图像中确定约1000-2000个候选框 b. 对于每个候选框内图像块,使用深度网络提取特征 c. 对候选框中

基于深度学习的目标检测研究进展

前言 开始本文内容之前,我们先来看一下上边左侧的这张图,从图中你看到了什么物体?他们在什么位置?这还不简单,图中有一个猫和一个人,具体的位置就是上图右侧图像两个边框(bounding-box)所在的位置.其实刚刚的这个过程就是目标检测,目标检测就是"给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标的具体类别". 目标检测对于人来说是再简单不过的任务,但是对于计算机来说,它看到的是一些值为0~255的数组,因而很难直接得到图像中有人或者猫这种高层语义概念,也不清楚目标出现在

视频目标检测

TCNN  静态图像中目标检测(rcnn,fast rcnn, faster rcnn, yolo, ssd 等) 上下文信息 使用图像检测算法将视频帧当做独立的图像来处理并没有充分利用整个视频的上下文信息.虽然说视频中可能出现任意类别的目标,但对于单个视频片段,只会出现比较少的几个类别,而且这几个类别之间有共现关系(出现船只的视频段中可能会有鲸鱼,但基本不可能出现斑马).所以,可以借助整个视频段上的检测结果进行统计分析:对所有检测窗口按得分排序,选出得分较高的类别,剩余那些得分较低的类别很可能

【目标检测】Faster RCNN算法详解

Ren, Shaoqing, et al. "Faster R-CNN: Towards real-time object detection with region proposal networks." Advances in Neural Information Processing Systems. 2015. 本文是继RCNN[1],fast RCNN[2]之后,目标检测界的领军人物Ross Girshick团队在2015年的又一力作.简单网络目标检测速度达到17fps,在P