Python 文本处理

1 文件内容互相复制

a = open(r‘C:\Users\kk\Desktop\a.txt‘,‘r‘)
b = open(r‘C:\Users\kk\Desktop\b.txt‘,‘w+‘)

for h in a.readlines():
    b.writelines(h)
a.close()
b.close()

或者:

import shutil
shutil.copyfile(r‘C:\Users\kk\Desktop\a.txt‘, r‘C:\Users\kk\Desktop\d.txt‘) 

2 将a文件复制到b文件 并且每行长度为8个字符

a = open(r‘C:\Users\kk\Desktop\a.txt‘,‘r+‘)
b = open(r‘C:\Users\kk\Desktop\b.txt‘,‘w+‘)
i=8

for c in a.readlines():
    for h in range(0,len(c),i):
        aa = c[h:h+i]+‘\n‘
        print aa
        b.write(aa)
        
        
3  替换文本中的某行 。将文本所有行变成列表然后切片

file = open(r‘C:\Users\kk\Desktop\a.txt‘,‘r+‘)
b =  file.readlines()
b[1] = ‘hello‘

file = open(r‘C:\Users\kk\Desktop\a.txt‘,‘w+‘)
file.writelines(b)
file.close()        

4 替换文本中某个字符

import  re
file = open(r‘C:\Users\kk\Desktop\a.txt‘,‘r+‘)

open(r‘C:\Users\kk\Desktop\c.txt‘, ‘w‘).write(re.sub(‘hello‘, ‘Love python‘, file.read()))

5 查找某个字符在多少行
file = open(r‘C:\Users\kk\Desktop\a.txt‘,‘r+‘)

for h ,num in enumerate(file.readlines()):
    if num.find(‘kexl‘) >= 0:
       print h,num
file.close()
时间: 2024-10-09 06:55:27

Python 文本处理的相关文章

Python 文本解析器

Python 文本解析器 一.课程介绍 本课程讲解一个使用 Python 来解析纯文本生成一个 HTML 页面的小程序. 二.相关技术 Python:一种面向对象.解释型计算机程序设计语言,用它可以做 Web 开发.图形处理.文本处理和数学处理等等. HTML:超文本标记语言,主要用来实现网页. 三.项目截图 纯文本文件: Welcome to ShiYanLou ShiYanLou is the first experiment with IT as the core of online ed

python文本 拼接或合并字符串

python文本 拼接.合并字符串 场景: 拼接.合并字符串 在这个场景中,我们首先想到的当然是使用+或者+=将两个字符串连接起来 >>> a='a'    >>> b='b'    >>> c=a+b    >>> c    'ab'    >>> 如果整个程序只有两个字符串需要拼接,那没有问题 但是如果程序里面大量存在拼接,甚至需要循环拼接,这个时候性能问题就会出现 原因:字符串是不可原地修改的,改变一个字符串就

Python文本爬虫实战

转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/7019950.html  一:流程 目标:爬取目标网页的图片 1:获取网页源码 2:用Python读取源码 3:使用正则表达式从网页源码提取图片地址 4:根据图片地址下载图片 二:实现 1:源码获取 文本爬虫,是在已有的文本内容中爬取需要的信息,这区别于网络爬虫. 由于被检索的内容是现成的,因此,文本爬虫又叫"半自动爬虫". 在本例中,我们以昵图网首页为目标网址,因此,我们先到昵图网首页,右键-&g

Python文本处理和Java/C比对

一:起因 (1)态度和思想的转变很重要:要说起学习Python的原因,也够曲折的 -- 很早之前就听说了Python 以及 Perl语言,一直有学习的打算和冲动:最后学习Python是由于学习<机器学习>,和国外的教学视频里面那些洋教授们,以及国外关于机器学习的API都是用到的Python语言,自己初试牛刀一把,感觉效率就是高,慢慢的观念就转变了. (2)态度和思想的转变很重要:学习一门新技术或者语言,跟人们认识事物的规律是一样一样 -- 刚刚接触新鲜事物时,第一反应排斥.反对(哪里都感觉别扭

【Python】Python文本处理中用langid工具包来对文本进行语言检测与判别

1.问题的描述 用Python进行文本处理时,有时候处理的文本中包含中文.英文.日文等多个语系的文本,有时候不能同时进行处理,这个时候就需要判别当前文本是属于哪个语系的.Python中有个langid工具包提供了此功能,langid目前支持97种语言的检测,非常好用. 2.程序的代码 以下Python是调用langid工具包来对文本进行语言检测与判别的程序代码: import langid #引入langid模块 def translate(inputFile, outputFile): fin

Python 文本处理的应用

最近根据公司运营部需求要对mongo数据库中的相关信息进行统计,本人一般喜欢将数据库服务器中相关的数据导出来(PS:其一由于Mongo为Nosql,在涉及关联表时不好处理,其二是因为虽然为测试环境,但是为了不影响性能的话我还是习惯将数据导出,但是缺点就是自己测试机压力比较大,不过针对于目前数据情况还是可以应付的). 根据createDate时间段导出的数据格式如下(已经经过处理,处理过程略过) 1 a : 5 , b: 111 , c: 5 2 a : 1 , b: 222 , c: 3 3 a

python自学笔记(五)python文本操作

一.python自带方法 r:read 读 w:write 写 a:append 尾行追加 先命令行进入python后 >>>d = open('a.txt','w') #在对应路径下打开a.txt文本,如果没有就创建一个,然后赋值给变量d >>>d.write('good\n hi') #写入 >>>d.close()#关闭文件 >>>d = open('a.txt','r') >>>print d.readlin

python文本处理之可视化wordcloud

什么是词云 词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思. 准备工作: python开发环境.wordcloud.jieba.matplotlib.numpy .PIL 等库文件安装好. pip 安装方法: pip install xxx 使用idea 直接安装 wordcloud生成词云的原理简介 wordcloud生成词云的原理其实并不复杂,大体分成5步(具体可自行查看源码): 1

Python文本

Python中的文本是一些内置类型的常量表示方法. 字符串和字节 字符串是一系列的字符序列,Python中用单引号(''),双引号(""),或者三个单引号(''' ''')三个双引号(""" """)来表示字符串常量. #fileName:lexical str_1 = 'hello python' str_2 = "What's your name?" str_3 = '''mile and silenc