Python制作本地数据集

 1 #####################################################
 2 # 功能:Python制作本地数据集
 3 #####################################################
 4
 5 # 导入相应包
 6 import os
 7 from PIL import Image
 8 import numpy as np
 9 from keras.utils import to_categorical
10
11 dir_path = ‘E:/prim/Sum‘  # 图片文件路径
12 labels = []
13 images = []
14
15 dir_len = len(os.listdir(dir_path))   # os.listdir():返回指定目录下的所有文件和目录名   len() 方法返回对象(字符、列表、元组等)长度或项目个数
16
17 # 直接读取单个中文文件夹
18 for i, name in enumerate(os.listdir(dir_path)):    # enumerate用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
19     print(‘%d/%d‘%(i+1, dir_len))
20
21     if not name.endswith(‘.jpg‘):
22         continue
23     # 准备标签
24     label = np.array(int(name.split(‘_‘)[0][4:]))   # 以下划线取第一个数字
25
26     # 准备图片
27     img = Image.open(os.path.join(dir_path, name)).resize((100, 100))  # 将每张图片固定成同样大小
28     img = np.array(img).astype(‘float32‘) / 0xff   # 转换成二进制数
29
30     labels.append(label)
31     images.append(img)
32
33 # 转numpy数组
34 images = np.array(images)
35 labels = np.array(labels)
36 labels = to_categorical(labels)
37
38 print("images:", images.shape)
39 print("labels:", labels.shape)
40
41 np.save(‘images‘, images)
42 np.save(‘labels‘, labels)
43
44 print(‘done!‘)

原文地址:https://www.cnblogs.com/Junlong/p/11320320.html

时间: 2024-11-08 21:58:38

Python制作本地数据集的相关文章

制作coco数据集以在Detectron框架上进行数据的训练

图片预处理 首先,根据Detectron官方介绍,数据集一般为jpg格式,分辨率一般为800*600左右. 在这里我们可以photoshop批量对图片进行处理 使用labelImg对数据集进行标注. 安装labelImg之后,打开文件目录,找到data文件夹下的predefined_classes.txt并打开,修改里面的内容,将自己定义的标签名添加到下面,这样在标注图片的时候,就会显示标签供选择. 打开labelImg Change Save Dir 为你选择保存XML文件的目录,Open D

linux mini模式下如何制作本地yum源,并用远程工具安装 vim

linux mini模式下如何制作本地yum源,并用远程工具安装 vim 打开虚拟机 启动centos 系统 点右下角的光盘图标 出现连接(或是断开).设置,下拉菜单,选择 "设置" 在虚拟机设置对话框内如图所示 [[email protected] ~]# vim -bash: /usr/bin/vim: 没有那个文件或目录 光盘挂载: 查看系统中所有的挂载信息 [[email protected] ~]# mount /dev/sda3 on / type ext4 (rw) pr

Windows 环境下运用Python制作网络爬虫

import webbrowser as web import time import os i = 0 MAXNUM = 1 while i <= MAXNUM: web.open_new_tab('要刷的网络地址') os.system('taskkill /F /IM 浏览器文件名(chrome.exe)') i += 1 else: print 'happly day!' 代码和简单只要一个第三方的函数和调用系统的文件就OK了.记住给要刷的次数定值,不然电脑就不好受了! Windows

访问webservice,导入xml至本地数据集

创建本地数据集 clientdataset2.FieldDefs.Clear;;  with clientdataset2.FieldDefs.AddFieldDef do  begin    Name := 'id';    Size := 10;    DataType := ftString;  end;  with clientdataset2.FieldDefs.AddFieldDef do  begin    Name := 'xm';    size := 10;    DataT

使用MBROSTool 工具制作本地硬盘F3救急模式的方法总结

前面写了一篇使用MBROSTool 工具制作本地硬盘多启动盘的方法总结.里面就是可以把一些系统安装到硬盘上面方便使用,比如安装PE到硬盘,不过启动的时候会先进入多UDm菜单,然后选择[启动本地系统]后才会进入本地的系统, 有的人不喜欢这种,或者只希望用PE,那么可以使用F3救急模式,也就是默认就没有变化,开机直接进入本地系统,只有按下F3的时候才进入PE系统,我之前也网上找过很多方法,不过都很麻烦,也很危险,曾经误操作导致分区表错误,丢失掉硬盘上的所有数据,下面就来用MBT实现这个功能. 首先F

Linux制作本地源

Linux制作本地源 由于项目需要在Ubuntu64位上搭建运行环境,需要安装很多软件,下载需要大量时间,并且需要安装的计算机可能由于条件限制无法上网,因此我们就需要制作一个本地源.一下是制作本地源需要的步骤: 1.拷贝所需安装软件包 通过apt-get安装的软件都在/var/cache/apt/archives目录下,在/目录下新建packages目录,并将所有的软件包拷贝到该目录下.(可以拷贝到任意路径下的目录里,该步骤主要是将所有软件包拷贝到一处,便于以后打包) 2..生成软件包信息(含有

python制作查找单词翻译的脚本

本人由于英语渣,在linux底下经常看文档,但是有没有想有道词典这种软件,所以遇到不懂的单词只能手动复制粘贴在网上查找,这样就很不方便,学了python之后,就试着自己尝试下个在命令行下查找单词翻译的脚本. 在我眼里,实现上面这个要求的脚本语言分几块完成: 一是选好一个单词翻译的网站,优先选择GET方法的(代码写起来比较方便),如果是POST方法也不是没有办法,只是要自己新建一个POST请求,为此我就找到了一个用GET方法查找单词的神器网站——在线翻译_在线词典_金山词霸_爱词霸英语,用起来就很

ubuntu制作本地源

背景 平时apt-get install安装软件时,下载的deb文件都会存放在/var/cache/apt/archives/下,为了今后重装或给别人用,特别是没有网络时,这些deb文件实际上是可以派上用途的,也就是可以用这些deb制作成本地源.这种方法还有一个应用场景: 先在有网络的服务器上面进行apt-get install安装 然后制作本地源 将本地源拷贝到没有网络的服务器上,然后在那台机器上设定sourcelist指向这个本地源,此时在那台没有网络的服务器上也可以执行apt-get in

使用python制作ArcGIS插件(1)工具介绍

使用python制作ArcGIS插件(1)工具介绍 by 李远祥 ArcGIS从10.0开始支持addin(ArcGIS软件中又叫作加载项)的方式进行插件制作.相对于以往9.x系列,addin的无论是从使用或者编写都更加方便快捷.通过开发语言,可以制作ArcGIS Desktop各个软件模块的插件. Addin支持多种开发语言,如.net.java和python.其中.net和java需要配合ArcGIS的SDK,使用ArcObjects进行开发.其好处是ArcObjects可以非常细粒度的控制