制作VOC格式的数据集(图像标注)

在进行深度学习训练时，需要创建自己的数据集，对图像中的目标区域进行标注。

工具：labelimg.exe，这个软件不知道是什么原因，打开闪退，所以最好还是使用github上的源码。

原作者的github：https://github.com/tzutalin/labelImg

这款工具是全图形界面，用Python和Qt写的，最牛的是其标注信息可以直接转化成为XML文件，与PASCAL VOC以及ImageNet用的XML是一样的。

由于我是在windows 进行的，所以只介绍windows上的过程：

首先在windows上安装python，这里安装的是Anaconda，它是一款python继承安装环境，主要是方便扩展包管理。

安装过程省略……

安装pyqt包：

打开anaconda命令行窗口，输入conda install pyqt=4，等待完成安装。

下载源码并进行解压，打开cmd命令行窗口，进入到解压文件夹的当前目标路径下，依次输入下面语句即可打开软件：

1 pyrcc4 -o resources.py resources.qrc
2 python labelImg.py

时间： 2024-10-19 20:15:00

制作VOC格式的数据集(图像标注)的相关文章

开源图像标注工具labelme的安装使用及汉化

一 LabelMe简介 labelme是麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发的图像标注工具,人们可以使用该工具创建定制化标注任务或执行图像标注,项目源代码已经开源. 项目开源地址:https://github.com/CSAILVision/LabelMeAnnotationTool labelMe项目地址:http://labelme.csail.mit.edu/Release3.0/ MIT的labelme源代码可以安装到服务器上使用,是一个在线的Javascri

图像处理项目——制作自己的人脸数据集

制作自己的人脸数据集 *开发环境为visual studio2010*使用的是opencv中的Haart特征分类器,harr Cascades*检测对象为人脸照片一:主要步骤 1.加载人脸检测器2.打开电脑摄像头,载入视频流,抽取帧,进行灰度化处理3.识别人脸,采集20张保存到文件中二 :代码 1 /**************************************************** 2 制作自己的人脸数据集: 3 1.加载人脸检测器 4 2.打开电脑摄像头,载入视频流

让你的Photoshop编辑制作ICO格式图标文件（ICOFormat支持图标文件插件）

相信很多制图的朋友都喜欢用PS,但是你能用Photoshop保存为ICO格式图标文件吗?默认肯定不行,不知道是什么原因,大名鼎鼎的图像编辑软件Adobe Photoshop一直不支持导入导出ico格式图标文件. 不过还好,ps支持插件,有了一个名为ICOFormat的插件,IcoFormat是一款可以让Photoshop支持ICO和CUR格式的PS插件,有了它就可以直接从ps里打开.保存ico和cur格式文件了. 一起来看看ICOFormat:让Photoshop支持导入导出ico和cur格式文

[转]自己动手制作chm格式开源文档

转自:自己动手制作chm格式开源文档下面我就来介绍一款工具来快速将html文档转化为chm格式文档: 这里需要两款工具:1.htmlhelp.EXE 2.jd2chm.exe, 工具下载地址:点我点我~ 1. 一般情况下我们要先安装htmlhelp.EXE,而jd2chm.exe是不需要安装的,待htmlhelp.EXE安装成功后,可能需要重启电脑 2.重启过后,我们将jd2chm.exe复制到html文档的所在的目录下,如下图: 转注:在这里你也可以将jd2chm.exe文件房在C:\WI

图像标注 python实现-LSTM篇

上一篇文章介绍了RNN的工作原理和在图像标注上的应用,这篇介绍RNN的变体LSTM. 要知道为什么会出现LSTM,首先来看RNN存在什么问题.RNN由于激活函数和本身结构的问题,存在梯度消失的现象,导致 (1)网络结构不能太深,不然深层网络的梯度可以基本忽略,没有起到什么作用,白白增加训练时间. (2)只能形成短期记忆,不能形成长期记忆. 因为梯度逐层减少,只有比较临近的层梯度才会相差不多,所以对临近的信息记忆比较多,对较远的信息记忆差. 接下来看看LSTM怎么解决这个问题: 所有 RNN 都具

深度学习图像标注工具VGG Image Annotator (VIA)使用教程

VGG Image Annotator (VIA)是一款开源的图像标注工具,由Visual Geometry Group开发. 可以在线和离线使用,可标注矩形.圆.椭圆.多边形.点和线.标注完成后,可以导出为csv和json文件格式. 地址:http://www.robots.ox.ac.uk/~vgg/software/via/. 中文使用教程: 原文:https://blog.csdn.net/heiheiya/article/details/81530952 原文地址:https://ww

将普通的图像数据制作成类似于MNIST数据集的.gz文件（数据集制作）

做完MNIST数据集的训练之后,我们想把自己的数据也拿来做一下相关的训练,那么如果调用MNIST数据读取的接口就需要按照他的数据格式来存取数据,首先来看看这个接口(input_data.read_data_set())): #coding=utf-8 #input_data.py的详解 #学习读取数据文件的方法,以便读取自己需要的数据库文件(二进制文件) """Functions for downloading and reading MNIST data."&qu

用tensorflow创建tfrecords格式的数据集

下面的代码是生成一个每个图片大小是227*227*1的tfrecord文件,label是这个类别的英文名. 原图片是256*256*3RGB型的.jpg文件,在制作数据集的时候由于对图片的颜色没有要求,所以为了节省空间,进行了灰度化处理. import tensorflow as tf import os import sys from PIL import Image import numpy as np # 数据集路径 TRAIN_DATASET_DIR = "E:/python文件/ten

[转]制作png格式透明图片的简易方法

原文地址:http://blog.csdn.net/zhouyingge1104/article/details/24460743 photoshp之类的专业软件太复杂,其实,制作透明图标有比较简易的方法,用PowerPoint或者国产的WPS演示就可以搞定. 以WPS演示为例,先打开一张图片,此时可以明显看出,图片是白色背景,并不透明. 然后,单击图片,顶部的工具栏里面出现了"设置透明色"选项,单击它,光标变成一支笔的形状: 然后在用这个光标在白色的部分单击一下,马上就透明了: 然后