python工具箱--文本读取

1、使用open() BIF 打开一个磁盘文件，创建一个迭代器从文件读取数据，一次读取一个数据行。

2、readline()方法从一个打开的文件读取一行数据。

3、seek()方法可以用来将文件“退回”到起始位置。

4、close()方法关闭一个之前打开的文件。

5、split()方法可以将一个字符串分解为一个字串列表。

6、Python中不可以改变的常量列表称为元组（tuple）。一旦将列表数据赋至一个元组，就不能再改变。元组时不可改变的。

7、数据不符合期望的格式时会出现ValueError。

8、数据无法访问时会出现IOError（例如，可能你的数据文件已经被移走或者重命名）。

9、help() BIF允许你在IDEL shell中访问Python的文档。

10、find()方法会在一个字符串中查找一个特定子串。

11、not关键字将一个条件取反。

12、try/except语句提供了一个异常处理机制，从而保护可能导致运行时错误的某些代码行。

13、pass语句就是Python的空语句或null语句，它什么也不做。

注1：

BIF(built-in functions) ，就是Python内嵌函数。

我们可以在python或IDLE shell中，键入dir(__builtins__)可以看到python的内置方法列表（"builtins"的前后都是两个下划线).

注2：

help()

查看内嵌函数时，直接help(open)

查看模块时，需要先导入模块。例如：

>>> import string
>>> help(string)

Help on module string:

NAME
string - A collection of string operations (most are no longer used).

FILE
/usr/lib/python2.7/string.py

MODULE DOCS
http://docs.python.org/library/string

DESCRIPTION
    Warning: most of the code you see here isn‘t normally used nowadays.
    Beginning with Python 1.6, many of these functions are implemented as
    methods on the standard string object. They used to be implemented by
    a built-in module called strop, but strop is now obsolete itself.

……

时间： 2024-08-05 10:52:21

python工具箱--文本读取的相关文章

Python将文本内容读取分词并绘制词云图

功能:Python将文本内容读取分词并绘制词云图 import matplotlib import matplotlib.pyplot as plt #数据可视化 import jieba #词语切割 import wordcloud #分词 from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #词云,颜色生成器,停止 import numpy as np #科学计算 from PIL import Image #处理图片

用python处理文本，本地文件系统以及使用数据库的知识基础

主要是想通过python之流的脚本语言来进行文件系统的遍历,处理文本以及使用简易数据库的操作. 本文基于陈皓的:<程序员技术练级攻略> 一.Python csv 对于电子表格和数据库导出文件,比较常见的文件格式是.csv,所以python中的csv模块也是一个比较重要的模块.下面介绍csv常用的方法. 1.csv.reader(csvfile, dialect='excel', **fmtparams) 该函数返回一个reader对象,能够以行遍历的形式遍历行里面的数据. csvfile——需

深入学习python解析并读取PDF文件内容的方法

这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应用.主要参考了一些已有的博客内容,代码. 主要思路是首先利用一个做项目的形式,描述所做的问题,运行环境,和需要安装的库,然后写代码,此代码是在python2.7中运行,然后写出在python3.6中运行的代码,并详细解释python2.7和python3.6中python库的一些不同之处,最后详细的

python根据文本生成词云图

python根据文本生成词云图效果代码 from wordcloud import WordCloud import codecs import jieba #import jieba.analyse as analyse from scipy.misc import imread import os from os import path import matplotlib.pyplot as plt from PIL import Image, ImageDraw, ImageFont

【Python】Python在文本分析中将中文和非中文进行分割

1.问题描述进行文本分析的时候需要将中文和非中文进行分开处理,下面通过Python将文本中的中文部分提取出来进行需要的处理. 2.问题解决开发环境:Linux 程序代码如下:split.py #!/usr/bin/python #-*- coding:utf-8 -*- import sys reload(sys) sys.setdefaultencoding("utf8") import re #导入正则表达式模块:re模块 def translate(inputFile, ou

python将文本转化成gif图片阅读

这是python吧的一个帖子(http://tieba.baidu.com/p/3030737423),具体的就是,导入txt文档,然后就会生成像一个gif的界面,文字不断的更换,用这种方法看文档,如图: 代码: # -*- coding: utf-8 -* #------------------------------------- import pygame from pygame.locals import * from sys import exit import time import

Python小程序,读取ACCESS数据库,然后list数据

曾经做过的一个Python小程序,读取ACCESS数据库,然后list数据 # -*- coding: cp936 -*-import wximport wx.libimport sys,glob,randomimport win32com.clientreload(sys)sys.setdefaultencoding('utf-8')class DemoFrame(wx.Frame): def __init__(self): wx.Frame.__init__(self,None,-1,u"安

教你利用python处理文本

我是个C/C++ Coder,并不是专业写python的,python lua其实属于一类语言,只不要python的库更多,强大之处并不完全是python语言特性,而且扩展库比较多,请允许我黑一下python,python始终是个脚本语言,优点缺点很明显,作为一个非轻量级脚本语言(与lua较之),python适合干很多系统相关的事情.这里就分析一下如何利用python处理文本,查找,提取. 假定我们要完成这样一个功能:搜索出指定目录内的所有文本,取出指定位置内容,并打印行数和所在的行内容. 遍历

【python-excel】Selenium+python自动化之读取Excel数据（xlrd）

Selenium2+python自动化之读取Excel数据(xlrd) 转载地址:http://www.cnblogs.com/lingzeng86/p/6793398.html ···························································································································