Python文件读取和数据处理

一.python文件读取

1.基本操作

读取文件信息时要注意文件编码,文件编码有UFT-8、ASCII或UTF-16等。

不过在python中最为常用的是UTF-8,所以如果不特别说明就默认UTF-8编码。

读取文件可以使用 rt 模式下的 open()函数,示例如下:

#以字符串的形式读取一个文件
with open(‘somefile.txt‘, ‘rt‘) as f:
    data = f.read()

with open(‘somefile.txt‘, ‘rt‘) as f:
    for line in file:                           #逐行处理数据
        #prossce line

2.文件与路径

文件有两个关键属性:“文件名”(通常写成一个单词)和“路径”。路径指明了文件在计算机上的位置。

例如,我的 Windows 10笔记本上有一个文件名为projects.docx,它的路径在C:\Users\Documents。文件名中,最后一个句点之后的部分称为文件的“扩展名”,它指出了文件的类型。project.docx 是一个Word 文档,Users和Documents 都是指“文件夹”(也成为目录)。

有两种方法指定一个文件路径。
• “绝对路径”,总是从根文件夹开始。
• “相对路径”,它相对于程序的当前工作目录。(少用)

#-*-encoding:uft-8-*-
import os

os.path.abs(‘C:\\user\\soft\\python‘)       #绝对路径

os.ispath(‘C:..\\python‘)       #相对路径

只有用绝对路径操作

#交互模式下
>>> import os
>>> path = ‘/Users/beazley/Data/data.csv‘
>>> # Get the last component of the path
>>> os.path.basename(path)
‘data.csv‘
>>> # Get the directory name
>>> os.path.dirname(path)
‘/Users/beazley/Data‘
>>> # Join path components together
>>> os.path.join(‘tmp‘, ‘data‘, os.path.basename(path))
‘tmp/data/data.csv‘
>>> # Expand the user‘s home directory
>>> path = ‘~/Data/data.csv‘
>>> os.path.expanduser(path)
‘/Users/beazley/Data/data.csv‘
>>> # Split the file extension
>>> os.path.splitext(path)
(‘~/Data/data‘, ‘.csv‘)
>>>

原文地址:https://www.cnblogs.com/justlikecode/p/10783704.html

时间: 2025-01-10 03:17:24

Python文件读取和数据处理的相关文章

一文贯通python文件读取

p.p1 {margin: 0.0px 0.0px 0.0px 0.0px; -webkit-hyphens: auto; font: 24.0px 'Helvetica Neue'; color: #3e3e3e; -webkit-text-stroke: #3e3e3e} p.p2 {margin: 0.0px 0.0px 0.0px 0.0px; -webkit-hyphens: auto; font: 16.0px 'Helvetica Neue'; color: #8c8c8c; -w

Python文件读取编码错误问题解决之(PyCharm开发工具默认设置的坑。。。)

刚接触Python学习,正准备做个爬虫的例子,谁知道代码一开始就遇到了一个大坑,狂汗啊. 问题是这样的:我通过代码爬取了博客园首页的HTML代码并存入到blog.txt文件当中,然后准备读取出来之后进行分析,可就在读取文件的这一步出现了问题. 执行读取代码的时候程序总是会抛一个叫 “UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 117274: illegal multibyte sequence

Python——文件读取与写入

一.文件打开方式   打开方式 指针位置 读取的文件类型 r 只读(默认模式) 指针在文件开头,文件不存在则报错 1. 默认读取文件都是ASCII编码的文本文件 2. 如果读取的文件是二进制文件,如图片,视频需要使用'rb'模式 3. 读取非ASCII编码的文本文件,必须 以二进制模式打开,再解码 f=open('E:/test.txt','rb') f.read().decode('gbk') rb 二进制格式只读 指针在文件开头,文件不存在则报错 r+ 可读可写 指针在文件开头,文件不存在则

超级基础的python文件读取

读取文件的两种方式: 1.使用os的open函数: import sys,os r=open("data1.txt","r+") fr=r.readlines() for i in fr: print(i.strip())#strip()去掉多余的空行 r.close() 2.使用codecs的open函数: import codecs f=codecs.open("zc.csv" ,"r" , "gbk"

python 文件读取和写入

f = open('pyehon测试.txt');#py2里可以使用 open 或 file 方法打开文件,py3 只能使用 open. #不加参数时,open为你默认为'r',reading,只读模式,不能写入且文件必须存在,否则引发异常. data = f.read();#读取文件中的所有内容 data2=f.readline();#读取一行内容 data3=f.readlines();#把内容按行读取至一个list中 f.close(); d = open('pyehon测试2.txt',

python文件读取:遇见的错误及解决办法

问题一: TypeError: 'str' object is not callable 产生原因: 该错误TypeError: 'str' object is not callable字面上意思:就是str不可以被系统调用, 其实原因就是:你正在调用一个不能被调用的变量或对象,具体表现就是你调用函数.变量的方式错误. 例子: filePath=kwargs['path'] filePathStr=str(filePath) 也就是自己在用的是关键字参数传参,传过来的时候是什么类型,传过来就是什

Python - 文件读取read()、readline()、readlines()区别

前言 读取文件的三个方法:read().readline().readlines().均可接受一个方法参数用以限制每次读取的数据量,但通常不使用 read() 优点:读取整个文件,将文件内容放到一个字符串变量中. 劣势:如果文件非常大,尤其是大于内存时,无法使用read()方法. 总结:不适用于读取大文件 简单代码 f = open('test/gbk.txt', 'r+', encoding='utf-8') print(f.read()) 测试结果 123 456 789 @#$% read

python文件读取

不在统一目录,需要绝对文件位置 mode="rb"直接打开是二进制格式,机器传送使用,视频流,图片等 f = open(file="E:\文件处理\兼职白领学生空姐模特护士联系方式utf8.txt",mode="r",encoding="utf-8")data = f.read()print(data)f.close() 原文地址:https://www.cnblogs.com/muncihlai/p/9478834.html

python文件读取操作

1 #IO操作 2 #模拟账号登录 3 4 data = [] #0=userName 1=password 5 6 obj = open("login.txt","r") 7 for line in obj: 8 data.append(line.strip("\n")) 9 obj.close() 10 11 12 while True: 13 print("---------") 14 print("| 登录