tensorflow 对csv数据进行批量获取

代码如下：

#读取文件数据

def read_data(file_queue):
# 读取的时候需要跳过第一行
reader = tf.TextLineReader(skip_header_lines=1)
key, value = reader.read(file_queue)
# 对于数据源中空的值设置默认值
record_defaults = [[‘‘], [‘‘], [‘‘], [‘‘], [0.], [0.], [0.], [0.], [‘‘],[0], [‘‘], [0.], [‘‘], [‘‘], [0]]
# 定义decoder，每次读取的执行都从文件中读取一行。然后，decode_csv 操作将结果解析为张量列表
province, city, address, postCode, longitude,latitude, price, buildingTypeId, buildingTypeName, tradeTypeId, tradeTypeName, expectedDealPrice, listingDate, delislingDate, daysOnMarket = tf.decode_csv(value, record_defaults)
return tf.stack([price,expectedDealPrice]),daysOnMarket

#批量获取
def create_pipeline(filename,batch_size,num_epochs=None):
file_queue = tf.train.string_input_producer([filename],num_epochs=num_epochs)
example,dayOnMarket = read_data(file_queue)#example,label 样本和样本标签,batch_size 返回一个样本batch样本集的样本个数
min_after_dequeue = 1000#出队后队列至少剩下的数据个数，小于capacity（队列的长度）否则会报错，
capacity = min_after_dequeue+batch_size#队列的长度
#example_batch,label_batch= tf.train.shuffle_batch([example,label],batch_size=batch_size,capacity=capacity,min_after_dequeue=min_after_dequeue)#把队列的数据打乱了读取
example_batch,daysOnMarket_batch= tf.train.batch([example,dayOnMarket],batch_size=batch_size,capacity=capacity)#顺序读取

return example_batch,daysOnMarket_batch

原文地址：https://www.cnblogs.com/bluesl/p/9215800.html

时间： 2024-10-10 02:53:05

tensorflow 对csv数据进行批量获取的相关文章

TensorFlow读取CSV数据（批量）

直接上代码: # -*- coding:utf-8 -*- import tensorflow as tf def read_data(file_queue): reader = tf.TextLineReader(skip_header_lines=1) key, value = reader.read(file_queue) defaults = [[0], [0.], [0.], [0.], [0.], ['']] Id,SepalLengthCm,SepalWidthCm,PetalLe

在对csv文件做批量获取时无法获取，程序不动

代码如下: coord = tf.train.Coordinator() threads = tf.train.start_queue_runners(coord=coord) for step in range(100): #获取正真的样本和标签 example, label = sess.run([example_batch, daysOnMarket_batch]) print('第%d批数据'%(step))

TensorFlow读取CSV数据

代码来源于官方文档,做了一些小小的调整: # -*- coding:utf-8 -*- import tensorflow as tf filename_queue = tf.train.string_input_producer(["file01.csv", "file02.csv"]) reader = tf.TextLineReader() key, value = reader.read(filename_queue) # Default values, i

HBase 高性能获取数据 - 多线程批量式解决办法

在前篇博客里已经讲述了通过一个自定义 HBase Filter来获取数据的办法,在末尾指出此办法的性能是不能满足应用要求的,很显然对于如此成熟的HBase来说,高性能获取数据应该不是问题.下面首先简单介绍了搜索引擎的性能,然后详细说明了HBase与MySQL的性能对比,这里的数据都是经过实际的测试获得的.最后,给出了采用多线程批量从HBase中取数据的方案,此方案经过测试要比通过自定义Filter的方式性能高出很多. Solr和HBase专辑 1.“关于Solr的使用总结的心得体会”(http:

TensorFlow高效读取数据的方法——TFRecord的学习

关于TensorFlow读取数据,官网给出了三种方法: 供给数据(Feeding):在TensorFlow程序运行的每一步,让python代码来供给数据. 从文件读取数据:在TensorFlow图的起始,让一个输入管线从文件中读取数据. 预加载数据:在TensorFlow图中定义常量或变量来保存所有数据(仅适用于数据量比较小的情况). 对于数据量较小而言,可能一般选择直接将数据加载进内存,然后再分batch输入网络进行训练(tip:使用这种方法时,结合yeild 使用更为简洁).但是如果数据量较

使用Powershell批量获取Exchange 2013邮箱用户容量使用量

今天有客户要求需要获取邮箱用户的一些基本信息,其中一项是邮箱容量使用情况.需要使用Powershell来批量获取这些信息,于是乎我开始着手编写Powershell脚本. 我了解到微软官网https://gallery.technet.microsoft.com/scriptcenter/Exchange-2010-2013-2016-cee5e558.提供了这个脚本,脚本实现的功能和我需要实现的功能大体一致,我也不用去费劲儿从头编写代码了.下面我将我改造后的脚本分享给大家. 1.脚本实现的功能

如何从统计中批量获取BD搜索关键词及对应的入口页面？

前面我们介绍了通过cnzz的访问明细获取到搜索关键词及对应的入口页面,但是从BD搜索进来的关键词无法完整显示,只能呈现一些bd图片搜索的关键词,这是因为百度宣布从去年5月开始逐渐取消了referer关键词显示,保护站点流量关键词数据信息,第三方将不再可以轻易地窃取到流量关键词,令站点数据更加私密化.站长需要获得网站流量关键词时,可以使用百度站长平台提供的搜索关键词工具或者百度统计相关功能进行查询.是不是有点垄断的意味呢?没办法,国内的市场份额摆在那.当然你也可以针对其他搜索引擎做专门的优化.从统

SQL Server中中数据行批量插入脚本的存储实现

看到博友SQL Server MVP桦仔的一篇博文“将表里的数据批量生成INSERT语句的存储过程的实现”.我仔细看来博文中的两个存储代码,自我感觉两个都不太满意,都是生成的单行模式的插入,数据行稍微大些性能会受影响的.所在公司本来就存在第二个版本的类似实现,但是是基于多行模式的,还是需要手工添加UNAION ALL来满足多行模式的插入.看到这边博文和基于公司数据行批量脚本的存储的确定,这次改写和增强该存储的功能. 本存储运行于SQL Server 2005或以上版本,T-SQL代码如下: 1

php从memcache读取数据再批量写入mysql的方法

这篇文章主要介绍了php从memcache读取数据再批量写入mysql的方法,可利用memcache缓解服务器读写压力,并实现数据库数据的写入操作,非常具有实用价值,需要的朋友可以参考下. 用 Memcache 可以缓解 php和数据库压力下面代码是解决高负载下数据库写入瓶颈问题,遇到最实用的:写入ip pv uv的时候,用户达到每分钟几万访问量,要记录这些数据,实时写入数据库必定奔溃. 用以下技术就能解决,还有如用户注册,同一时间断内,大量用户注册,可以缓存后一次性写入到数据库,代码如下 pu

猜你喜欢

HDOJ 1197 Specialized Four-Digit Numbers

[题意]:输出四位数中所有十进制=十二进制=十六进制的数. [思路]:穷举就OK.避免重复可以再函数中增加一个位数的参数,这样三个函数写一个就行. [AC代码]: #include <iostr ...

常用布局，div竖直居中

常用两列布局,多列布局和div竖直居中 body { margin: 0; padding: 0; } .w200 { width: 200px; } .mar-left200 { margin-le ...

PHP扩展类ZipArchive实现压缩Zip文件和文件打包下载

1 <?php 2 /** 3 * 关于文件压缩和下载的类 4 * @author tycell 5 * @version 1.0 6 */ 7 class zip_down{ 8 9 prot ...

Java中引用类 strong reference .SoftReference 、 WeakReference 和 PhantomReference的区别

当在 Java 2 平台中首次引入 java.lang.ref 包,其中包含 SoftReference . WeakReference 和 PhantomReference 三个引用类,引用类的主要 ...

你应当知道的Java牛人

Java领域有非常多著名的人物,他们为Java社区编写框架.产品.工具或撰写书籍改变了Java编程的方式. 本文是<最受欢迎的8位Java牛人>的2.0版本号. PS:排名不分先后.本文的 ...

抠适暇捞醒b7389legsh2

首页时政国际国内财经文娱生活图片视频专栏双语爱出国移动新媒体中国搜索中文国际 > 独家香港富商刘銮雄斥4.8亿购两颗巨钻赠爱女曾因行贿被判刑中国日报网信莲2015-11-12 17: ...

Thinkphp回顾(五)之前台模板中的基本语法

一.导入CSS和JS文件的三种方式 (了解) 1.link方式(常规) <link rel=’stylesheet’ type=’text/css’ href=’__PUBLIC__/Js/ ...

bootstrap的treeview checked属性 ----解决方案

今天在开发过程中遇到了两个小问题,因为在做树形结构展示,用的是bootstrap的treeview,在获取json data的时候有几点需要注意 1)"pid":5,"i ...

Android上传图片到PHP服务器并且支持浏览器上传文件（word、图片、音乐等）

暑假已经过了一半了,这才完成计划当中的第二个任务.虽然进度是慢了点.但也算是暑假的收获吧.下面我就把我学习当中的收获记录在此. 还是跟以往一样,先上图片. 操作的步骤:打开程序---->选择上传 ...

mysql语法充电

1.关键字delimiter 的作用 ①delimiter叫做“定界符” ,经常可以在复合sql语句或者存储过程等语句中看到 DELIMITER $$ 的内容, ②DELIMITER $$的意义是告 ...

CSS id 和 class 选择器编辑

CSS id 和 class 选择器编辑如果你要在HTML元素中设置CSS样式,你需要在元素中设置"id" 和 "class"选择器.[1] id 选择器id ...

KeyMob:一站式移动应用广告聚合管理平台

国内的应用开发者都是折翼的天使,在辛辛苦苦写完代码处理了各种分辨率.兼容性问题之后,还要面对可能要发布到国内多家应用市场,各种应用中心.下载中心.各种线下推广的巨大悲剧情况,再加上每周版本更新的大循环 ...

第四章 Leader选举算法分析

Leader选举学习leader选举算法,主要是从选举概述,算法分析与源码分析(后续章节写)三个方面进行. Leader选举概述服务器启动时期的Leader选举选举的隐式条件便是ZooKeepe ...

企业建站有必要采用片头动画设计

很多企业越来越重视企业建站,自从互联网的快速发展,企业建站慢慢成为企业市场的重要平台,为了企业网站,企业开始纷纷运用上动画效果设计了,即通过flash动画设计,从而让企业网站变得精彩缤纷,具有视觉冲击 ...

复旦大学附属耳鼻喉医院的某位主任医师不负责任

这是我的真实就诊经历,且听我下面说为啥不建议大家去约这家三甲医院的周末专家门诊.我的就诊目的是想让医生根据我个人的CT结果,来诊断是否严重到要动手术的地步了,结果你知道这位专家,这位三甲医院的主治医生 ...

.NET WinForm程序中给DataGridView表头添加下拉列表实现数据过滤

转:http://www.cnblogs.com/jaxu/archive/2011/08/04/2127365.html 我们见过Excel中的数据过滤功能,可以通过点击表头上的下拉列表来实现数据的 ...

让你的HTML5&CSS3网站在老IE中也能正常显示的3种方法

起初,IE其实也是一款非常有进取心的浏览器.但经过一段时间的蛰伏后,它已经成为了我们生活中的一道障碍.微软现在又重新开始向其它浏览器发起挑战,但事实情况是,新版的现代IE浏览器一直滞后于谷歌浏览器和火 ...

IPv4（三）地址掩码

回顾网络类型确定回顾一下之前学过的如果确定IP地址网络号,这里先不考虑子网. 首先通过首个八位组字节规则很容易确定IP地址属于那个网络: 如果第1位是0,则是A类地址: 如果前两位是10,则是B类地 ...

第七届R语言会议 - 小记

第七届中国R语言会议小记 R语言始于1993年,并在1995年首次发布,后来经过2000年R-1.0,2004年R-2.0和2013年R-3.0,以61%的得票荣登世界编程或同积累语言排行榜榜首,远 ...

最优贸易（codevs 1173）题解

[问题描述] C 国有n 个大城市和m 条道路,每条道路连接这n 个城市中的某两个城市.任意两个城市之间最多只有一条道路直接相连.这m 条道路中有一部分为单向通行的道路,一部分为双向通行的道路,双向通 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.