将普通的图像数据制作成类似于MNIST数据集的.gz文件（数据集制作）

做完MNIST数据集的训练之后，我们想把自己的数据也拿来做一下相关的训练，那么如果调用MNIST数据读取的接口就需要按照他的数据格式来存取数据，首先来看看这个接口（input_data.read_data_set()））：

#coding=utf-8

#input_data.py的详解
#学习读取数据文件的方法，以便读取自己需要的数据库文件（二进制文件）
"""Functions for downloading and reading MNIST data."""
from __future__ import print_function
import gzip
import os
import urllib
import numpy
import matplotlib.pyplot as plt
SOURCE_URL = ‘http://yann.lecun.com/exdb/mnist/‘
def maybe_download(filename, work_directory):
  """Download the data from Yann‘s website, unless it‘s already here."""
  #判断目录文件是否存在，不存在则创建该目录
  if not os.path.exists(work_directory):
    os.mkdir(work_directory)
  #需要读取的文件路径
  filepath = os.path.join(work_directory, filename)
  if not os.path.exists(filepath):
    filepath, _ = urllib.urlretrieve(SOURCE_URL + filename, filepath)
    statinfo = os.stat(filepath)
    print(‘Succesfully downloaded‘, filename, statinfo.st_size, ‘bytes.‘)
  return filepath

def _read32(bytestream):
  dt = numpy.dtype(numpy.uint32).newbyteorder(‘>‘)
  return numpy.frombuffer(bytestream.read(4), dtype=dt)[0]

def extract_images(filename):
  """Extract the images into a 4D uint8 numpy array [index, y, x, depth]."""
  print(‘Extracting‘, filename)
  with gzip.open(filename) as bytestream:
    magic = _read32(bytestream)

    if magic != 2051:
      raise ValueError(
          ‘Invalid magic number %d in MNIST image file: %s‘ %
          (magic, filename))

    num_images = _read32(bytestream)
    print(num_images)
    rows = _read32(bytestream)
    print(rows)
    cols = _read32(bytestream)
    print(cols)
    buf = bytestream.read(rows * cols * num_images)
    print(‘hhh‘)
    data = numpy.frombuffer(buf, dtype=numpy.uint8)
    data = data.reshape(num_images, rows, cols, 1)
    return data
#将稠密标签向量变成稀疏的标签矩阵
#eg：若原向量的第i行为3，则对应稀疏矩阵的第i行下标为3的值为1，其余为0
def dense_to_one_hot(labels_dense, num_classes=10):
  """Convert class labels from scalars to one-hot vectors."""
  num_labels = labels_dense.shape[0]
  index_offset = numpy.arange(num_labels) * num_classes
  labels_one_hot = numpy.zeros((num_labels, num_classes))
  #labels_dense.ravel()将整个数组展成一个一维数组
  #labels_dense.flat[i]即将labels_dense看成一个一维数组，取其第i个变量
  labels_one_hot.flat[index_offset + labels_dense.ravel()] = 1#报错？
  return labels_one_hot

def extract_labels(filename, one_hot=False):
  """Extract the labels into a 1D uint8 numpy array [index]."""
  print(‘Extracting‘, filename)
  with gzip.open(filename) as bytestream:
    magic = _read32(bytestream)
    if magic != 2049:
      raise ValueError(
          ‘Invalid magic number %d in MNIST label file: %s‘ %
          (magic, filename))
    num_items = _read32(bytestream)
    buf = bytestream.read(num_items)
    labels = numpy.frombuffer(buf, dtype=numpy.uint8)
    if one_hot:
      return dense_to_one_hot(labels)
    return labels
class DataSet(object):
  def __init__(self, images, labels, fake_data=False):
    if fake_data:
      self._num_examples = 10000
    else:
      assert images.shape[0] == labels.shape[0], (
          "images.shape: %s labels.shape: %s" % (images.shape,
                                                 labels.shape))
      self._num_examples = images.shape[0]
      # Convert shape from [num examples, rows, columns, depth]
      # to [num examples, rows*columns] (assuming depth == 1)

      assert images.shape[3] == 1
      images = images.reshape(images.shape[0],
                              images.shape[1] * images.shape[2])
      # Convert from [0, 255] -> [0.0, 1.0].
      images = images.astype(numpy.float32)
      images = numpy.multiply(images, 1.0 / 255.0)
    self._images = images
    self._labels = labels
    self._epochs_completed = 0
    self._index_in_epoch = 0
  @property
  def images(self):
    return self._images
  @property
  def labels(self):
    return self._labels
  @property
  def num_examples(self):
    return self._num_examples
  @property
  def epochs_completed(self):
    return self._epochs_completed
  def next_batch(self, batch_size, fake_data=False):
    """Return the next `batch_size` examples from this data set."""
    if fake_data:
      fake_image = [1.0 for _ in xrange(784)]
      fake_label = 0
      return [fake_image for _ in xrange(batch_size)], [fake_label for _ in xrange(batch_size)]
    start = self._index_in_epoch
    self._index_in_epoch += batch_size
    #若当前训练读取的index>总体的images数时，则读取读取开始的batch_size大小的数据
    if self._index_in_epoch > self._num_examples:
      # Finished epoch
      self._epochs_completed += 1
      # Shuffle the data
      perm = numpy.arange(self._num_examples)
      numpy.random.shuffle(perm)
      self._images = self._images[perm]
      self._labels = self._labels[perm]
      # Start next epoch
      start = 0
      self._index_in_epoch = batch_size
      assert batch_size <= self._num_examples
    end = self._index_in_epoch
    return self._images[start:end], self._labels[start:end]
def read_data_sets(train_dir, fake_data=False, one_hot=False):
  class DataSets(object):
    pass
  data_sets = DataSets()
  if fake_data:
    data_sets.train = DataSet([], [], fake_data=True)
    data_sets.validation = DataSet([], [], fake_data=True)
    data_sets.test = DataSet([], [], fake_data=True)
    return data_sets
  TRAIN_IMAGES = ‘train-images-idx3-ubyte.gz‘
  TRAIN_LABELS = ‘train-labels-idx1-ubyte.gz‘
  TEST_IMAGES = ‘t10k-images-idx3-ubyte.gz‘
  TEST_LABELS = ‘t10k-labels-idx1-ubyte.gz‘
  VALIDATION_SIZE = 5000
  local_file = maybe_download(TRAIN_IMAGES, train_dir)
  train_images = extract_images(local_file)
  local_file = maybe_download(TRAIN_LABELS, train_dir)
  train_labels = extract_labels(local_file, one_hot=one_hot)
  local_file = maybe_download(TEST_IMAGES, train_dir)
  test_images = extract_images(local_file)
  local_file = maybe_download(TEST_LABELS, train_dir)
  test_labels = extract_labels(local_file, one_hot=one_hot)
  validation_images = train_images[:VALIDATION_SIZE]
  validation_labels = train_labels[:VALIDATION_SIZE]
  train_images = train_images[VALIDATION_SIZE:]
  train_labels = train_labels[VALIDATION_SIZE:]
  data_sets.train = DataSet(train_images, train_labels)
  data_sets.validation = DataSet(validation_images, validation_labels)
  data_sets.test = DataSet(test_images, test_labels)
  return data_sets
HHH = extract_images(‘D:\\train-images-idx3-ubyte.gz‘)
Pic = HHH[1]
print(type(HHH[1]))
print(numpy.shape(HHH[1]))
L = numpy.reshape(Pic, [28, 28])
plt.figure(1)
plt.imshow(L)

时间： 2024-10-06 00:06:24

将普通的图像数据制作成类似于MNIST数据集的.gz文件（数据集制作）的相关文章

Ubuntu 14.04 将一个sh文件制作成类似于windows下的可以双击执行的快捷方式

# 创建文件 touch test.desktop # 在test.desktop中写入如下内容 [Desktop Entry] Version=1.0 Type=Application Terminal=true Exec=/root/aa.sh Name=test Icon=/root/test.png # 修改test.desktop的权限为775(sudo chmod 775 test.desktop) 上面的步骤即建立了一个/root/aa.sh的快捷方式,快捷方式的图标就会变成ico

CAFFE学习笔记（四）将自己的jpg数据转成lmdb格式

1 引言 1-1 以example_mnist为例,如何加载属于自己的测试集? 首先抛出一个问题:在example_mnist这个例子中,测试集是人家给好了的.那么如果我们想自己试着手写几个数字然后验证识别效果又当如何呢? 观察CAFFE_ROOT/examples/mnist/下的lenet_train_test.prototxt文件,发现里面既给出了训练集的路径,又给出了测试集的路径.因此答案很显然了,我们可以把自己的测试集做成leveldb(或lmdb)格式的,然后在lenet_train

Linux的.run文件简单制作

run程序安装包实质上是一个安装脚本加要安装的程序,如下图所示:|-----------------|| || 安装脚本 || ||-----------------|| || 程序 || ||-----------------|图: run安装包的结构这样整个run安装包结构就一目了然了,实际上因为实际需要结构多少有点变动但这个无关紧要,只需要明白原理就行了.制作run安装包以下举个实际的例子:为了简单起见,要安装的程序就是helloworld程序,安装它的过程就是把它拷贝到/bin目录下.

图像数据到网格数据-1——MarchingCubes算法

原文:http://blog.csdn.net/u013339596/article/details/19167907 概述之前的博文已经完整的介绍了三维图像数据和三角形网格数据.在实际应用中,利用遥感硬件或者各种探测仪器,可以获得表征现实世界中物体的三维图像.比如利用CT机扫描人体得到人体断层扫描图像,就是一个表征人体内部组织器官形状的一个三维图像.其中的感兴趣的组织器官通过体素的颜色和背景加以区别.如下图的人体足骨扫描图像.医生通过观察这样的图像可以分析病人足骨的特征,从而对症下药. 这类

DICOM医学图像处理：DICOM存储操作之“多幅BMP图像数据存入DCM文件”

背景: 本专栏"DICOM医学图像处理"受众较窄,起初只想作为自己学习积累和工作经验的简单整理.前几天无聊浏览了一下,发现阅读量两极化严重,主要集中在"关于BMP(JPG)与DCM格式转换"和"DICOM 通讯协议",尤其是许久前的第一篇博文DCMTK开源库的学习笔记1:将DCM文件保存成BMP文件或数据流(即数组).因此在2014年底前打算写几篇关于DCM格式转换的文章,此次主要聚焦"如何将BMP.JPG等常规图像保存成DCM文件&q

朋友发来的图片，要制作成身份证复印件，怎么办？

前期调查: A4纸尺寸 210mm×297mm 第二代居民身份证为多层聚酯材料复合而成的单页卡式证件,长度85.6mm,宽度54mm,厚度0.9mm. 大概步骤: 新建A4纸尺寸 210mm×297mm的画布 ctrl + r 调出标尺,用U 选框工具,画出身份证的尺寸,栅格化.完成身份证模板制作. 接下来,放入你朋友发你的照片,CTRAL + T 尺寸调整好后.先点击模板,按W 魔棒操作,选中调整好的区域.然后在原来图层上面新建图层.得到想要的图层后把原来图层删除掉,得到一个想要的图像. 后

DICOM医学图像处理：DICOM存储操作之 “多幅JPG图像数据存入DCM文件”

背景: 续上篇,继续介绍如何将多幅JPG图像数据存入DCM文件.即将有损压缩数据直接写入DCM文件,存储为Multi-frame形式. 多幅JPG图像数据存入DCM文件: 为了避免引起歧义,这里着重说明一下.本博文的描述的场景是:假设我们手中有多张JPG文件,想把JPG文件写入DCM文件,即单个DCM文件包含多幅图像信息的Multi-Frame形式.该问题之前与CSDN博友y317215133y也讨论过,当时我在OFFIS论坛中找到了一个帖子直接给了y317215133y答复.今天重新梳理了一下

OpenCV中IplImage图像格式与BYTE图像数据的转换

最近在将Karlsruhe Institute of Technology的Andreas Geiger发表在ACCV2010上的Efficent Large-Scale Stereo Matching代码仿真.Andreas提供的源码中没有使用opencv,导致我一时无法适应如何显示处理的中间结果.将对应的库加载后,仿照采集相机图像数据的方式,从内存中读取对应图像到IplImage类型指针指定的内存空间,方便代码的调试和效果观测.其中用到的部分资料如下. *******************

第七章 KinectV2结合MFC显示和处理图像数据（下）

第七章 KinectV2结合MFC显示和处理图像数据(下) 首先声明一下,本系统所使用的开发环境版本是计算机系统Windows 10.Visual Studio 2013.Opencv3.0和Kinect SDK v2.0.这些都可以在百度上找到,download下来安装一下即可. 一.在MFC中如何显示OpenCV的图像Mat 前段时间一直在学习opencv,但学习过程中写的例子都是基于控制台的.今天打算把之前写的一些例子都移植到MFC中,基本上就是复制以前的代码,唯一的区别在于在控制台中,