tensorflow-读写数据tf.data(2)

从简单的、可重用的部分构建复杂的输入管道。

例如,图像模型的管道可以聚合分布式文件系统中文件中的数据,对每个图像应用随机扰动,并将随机选择的图像合并成一批进行训练。文本模型的管道可能包括从原始文本数据中提取符号,将它们转换为嵌入查找表的标识符,以及将不同长度的序列批处理在一起。

tf.data API使处理大量数据、不同的数据格式和复杂的转换变得容易。

tf.data.Dataset表示一个元素序列,其中每个元素包含一个或多个张量对象。例如,在图像管道中,元素可能是单个训练示例,其中有一对张量表示图像数据和一个标签。创建数据集有两种不同的方法:

创建一个源(例如data et.from_tensor_slice())从一个或多个tf.Tensor 构造一个数据集。

应用转换(例如data et.batch())从一个或多个tf.data.Dataset构造一个数据集

tf.data.Iterator 提供了从数据集中提取元素的主要方法。

Iterator.get_next()返回的操作在执行时生成数据集的下一个元素,通常充当输入管道代码和模型之间的接口。最简单的迭代器是“一次性迭代器”,它与特定的数据集关联并迭代一次。对于更复杂的用途,迭代器。初始化器操作使您能够使用不同的数据集重新初始化和参数化迭代器,例如,您可以在同一个程序中多次迭代训练和验证数据。

原文地址:http://blog.51cto.com/13959448/2333034

时间: 2024-10-21 22:21:53

tensorflow-读写数据tf.data(2)的相关文章

HDFS读写数据块--${dfs.data.dir}选择策略

最近工作需要,看了HDFS读写数据块这部分.不过可能跟网上大部分帖子不一样,本文主要写了${dfs.data.dir}的选择策略,也就是block在DataNode上的放置策略.我主要是从我们工作需要的角度来读这部分代码的. 1 hdfs-site.xml 2 <property> 3 <name>dfs.data.dir</name> 4 <value>/mnt/datadir1/data,/mnt/datadir2/data,/mnt/datadir3/

『TensorFlow』数据读取类_data.Dataset

一.资料 参考原文: TensorFlow全新的数据读取方式:Dataset API入门教程 API接口简介: TensorFlow的数据集 二.背景 注意,在TensorFlow 1.3中,Dataset API是放在contrib包中的: tf.contrib.data.Dataset 而在TensorFlow 1.4中,Dataset API已经从contrib包中移除,变成了核心API的一员: tf.data.Dataset 此前,在TensorFlow中读取数据一般有两种方法: 使用p

tf.data.Dataset.from_tensor_slices中的shuffle()、repeat()、batch()用法

引用库文件 from __future__ import absolute_import, division, print_function, unicode_literals import numpy as np import pandas as pd import tensorflow as tf from tensorflow import feature_column from tensorflow.keras import layers from sklearn.model_selec

python3 zip 与tf.data.Data.zip的用法

###python自带的zip函数 与 tf.data.Dataset.zip函数 功能用法相似 ''' zip([iterator1,iterator2,]) 将可迭代对象中对应的元素打包成一个元祖,返回有这些元祖组成的对象,用list把这个对象转化成列表 ''' a=[1,2,3] b = [4,5,6] c = [7,8,9,10,11] res1 = zip(a,b) res2 = zip(a,c) print('返回一个对象%s,用list转化成列表:'%res1,list(res1)

【转】iphone 输入/输出流异步读写数据

原文:iphone 输入/输出流异步读写数据 分类: iphone2012-05-30 14:50 2484人阅读 评论(1) 收藏 举报 iphoneattributesinterfacepathstreamfile 1.首先是往文件里写入数据 WriteFile.h [cpp] view plaincopy #import <Foundation/Foundation.h> #import <UIKit/UIKit.h> @class NoteDb; @interface Wr

STM32F10X SPI操作flash MX25L64读写数据(转)

源:STM32F10X SPI操作flash MX25L64读写数据 前一段时间在弄SPI,之前没接触过嵌入式外围应用,就是单片机也只接触过串口通信,且也是在学校的时候了.从离开手机硬件测试岗位后,自己一直想在嵌入式方面发展,在1月4号开始自己的第二份工作后,首先接触到的是为STM32F103写SPI控制flash读写操作,现记下曾经的脚印,希望以后能少走弯路!心得:细心活! 简单的一种应用,ARM芯片作为master,flash为slaver,实现单对单通信.ARM主控芯片STM32F103,

TensorFlow中数据读取之tfrecords

关于Tensorflow读取数据,官网给出了三种方法: 供给数据(Feeding): 在TensorFlow程序运行的每一步, 让Python代码来供给数据. 从文件读取数据: 在TensorFlow图的起始, 让一个输入管线从文件中读取数据. 预加载数据: 在TensorFlow图中定义常量或变量来保存所有数据(仅适用于数据量比较小的情况). 对于数据量较小而言,可能一般选择直接将数据加载进内存,然后再分batch输入网络进行训练(tip:使用这种方法时,结合yield 使用更为简洁,大家自己

.net环境下跨进程、高频率读写数据

原文:.net环境下跨进程.高频率读写数据 一.需求背景 1.最近项目要求高频次地读写数据,数据量也不是很大,多表总共加起来在百万条上下. 单表最大的也在25万左右,历史数据表因为不涉及所以不用考虑, 难点在于这个规模的热点数据,变化非常频繁. 数据来源于一些检测设备的采集数据,一些大表,有可能在极短时间内(如几秒钟)可能大部分都会变化, 而且主程序也有一些后台服务需要不断轮询.读写某种类型的设备,所以要求信息交互时间尽可能短. 2.之前的解决方案是把所有热点数据,统一加载到共享内存里边,到也能

TensorFlow的数据读取机制

一.tensorflow读取机制图解 首先需要思考的一个问题是,什么是数据读取?以图像数据为例,读取的过程可以用下图来表示 假设我们的硬盘中有一个图片数据集0001.jpg,0002.jpg,0003.jpg……我们只需要把它们读取到内存中,然后提供给GPU或是CPU进行计算就可以了.这听起来很容易,但事实远没有那么简单.事实上,我们必须要把数据先读入后才能进行计算,假设读入用时0.1s,计算用时0.9s,那么就意味着每过1s,GPU都会有0.1s无事可做,这就大大降低了运算的效率. 如何解决这