[数据科学] 从text, json文件中提取数据

文本文件是基本的文件类型,不管是csv, xls, json, 还是xml等等都可以按照文本文件的形式读取。

#-*- coding: utf-8 -*-
fpath = "data/textfile.txt"

f = open(fpath, ‘r‘)

## 按照字符读取字符
first_char = f.read(1)
print "first char: ", first_char

## 改变文件对象的位置, 位置是按照bytesize计算的
## 如果不把位置转到开始,后来读取都是从现在的位置开始
f.seek(0)

## 读取文件所有的内容
all_chars = f.read()
print all_chars

## 按照行读数据
f.seek(0)
first_line = f.readline()
print ‘first line: ‘,first_line

## 读取所有行
f.seek(0)
all_lines = f.readlines()
num_lines = len(all_lines)
print "number of lines: ", num_lines

for i, line in f:
    print i, line

在数据科学中,json也是最常用的文件形式之一,python对json有很好的支持。

import json

f = open(‘data/donut.json‘, ‘r‘)
## 根据json的形式,读取出来的数据是list 或者 dict
data = json.load(f)

print "type: ", type(data)
print data
时间: 2024-10-06 09:54:32

[数据科学] 从text, json文件中提取数据的相关文章

如何使用JMETER从JSON响应中提取数据

如果你在这里,可能是因为你需要使用JMeter从Json响应中提取变量. 好消息!您正在掌握掌握JMeter Json Extractor的权威指南.作为Rest API测试指南的补充,您将学习掌握Json Path Expressions所需的一切. 我们走吧!并且不要惊慌,那里没有什么困难. Json格式 为了更好地理解Json是什么,这是一个示例Json文档: { "store": { "book": [ { "category": &qu

如何使用JMeter从文件中提取数据

在性能测试方面,重用响应数据至关重要.几乎(如果不是全部!)负载测试场景假设您: 从先前的响应中提取有趣的方面,并在下一个请求中重用它们(也称为相关) 确保实际响应符合预期(又称断言) 因此,如果您是性能测试工程师,那么了解如何实现此关联和断言逻辑非常重要.幸运的是,BlazeMeter的知识库和JMeter博客已经有一些关于如何做到这一点的精彩文章.请查看以下内容: 使用带有JMeter的RegEx(正则表达式提取器) - 使用Perl5样式的正则表达式解析响应 在JMeter中使用XPath

接口自动化(三)--读取json文件中的数据

上篇讲到实际的请求数据放置在json文件内,这一部分记述一下python读取json文件的实现. 代码如下(代码做了简化,根据需要调优:可做一些容错处理): 1 import json 2 3 class operateJson(): 4 def __init__(self,jsonPath=None): 5 self.jsonPath = jsonPath #传入json文件路径 6 7 #读取json文件的内容 8 def readJson(self): 9 with open(self.j

SQLServer 从xml 文件中提取节点数据到数据库中

原文出处:http://blog.csdn.net/kk185800961/article/details/12350715  转载请注明出处 XML实例文件: <?xml version="1.0" encoding="utf-8"?> <!-- edited with XMLSpy v2010 (http://www.altova.com) by fengshuai (founder) --> <Root> <Frame

[转]【流媒體】H264—MP4格式及在MP4文件中提取H264的SPS、PPS及码流

[流媒體]H264—MP4格式及在MP4文件中提取H264的SPS.PPS及码流 SkySeraph Apr 1st 2012  Email:[email protected].com 一.MP4格式基本概念 MP4格式对应标准MPEG-4标准(ISO/IEC14496) 二.MP4封装格式核心概念 1  MP4封装格式对应标准为 ISO/IEC 14496-12(信息技术 视听对象编码的第12部分: ISO 基本媒体文件格式/Information technology Coding of a

添加JSON Data到已经存在的JSON文件中

早上在学习<Post model至Web Api创建或是保存数据>http://www.cnblogs.com/insus/p/4343833.html ,如果你第二添加时,json文件得到的数据只能是单笔记录且是最新的. 那需要怎样把新添加的json数据附加至已经存在的数据中去?本篇Insus.NET就是想实现此功能. 想法是先读取json文件的数据转换为数据集存放在内存中,新添加的数据再附加上去,然后再把内存的数据集序列化保存为json文件即可. 上面代码示例中,有3大部分,第一部分是读取

序列化和反序列化:将本地文件中的数据反序列化成实体对象

(1)将本地文件中的数据反序列化成实体对象 (2)将实体对象序列化 .txt中json格式的数据为:{"Name":"张三","Age":20,"Address":"上海市徐汇区"} 第一步: 添加dll引用:Newtonsoft.Json.dll (网上下载一个) using Newtonsoft.Json; 第二步: 新建一个Student实体类: public class Student { publ

lua向文件中写入数据,进行记录

function readfile(path) local file = io.open(path, "r") if file then local content = file:read("*a") io.close(file) return content end return nil end function writefile(path, content, mode) mode = mode or "w+b" local file = i

【Python】从文件中读取数据

从文件中读取数据 1.1 读取整个文件 要读取文件,需要一个包含几行文本的文件(文件PI_DESC.txt与file_reader.py在同一目录下) PI_DESC.txt 3.1415926535 8979323846 2643383279 5028841971 file_reader.py with open("PI_DESC.txt") as file_object: contents = file_object.read() print(contents) 我们可以看出,读取