python 将word另存为txt

import os
import os.path
from win32com import client as wc

c=[]  

rootdir=["d:/77"]                #以该路径为实验

def txt(j,c):

         word = wc.Dispatch(‘Word.Application‘)

         doc = word.Documents.Open(c[j])

         newname=c[j][:-5]+"(translate txt)"

         doc.SaveAs(newname,4)

         doc.Close()

         word.Quit()

         os.remove(c[j])

         print("完成")

def wordt(c):                    #定义函数,进行筛选

        for j in range(0,len(c)):

                if c[j][-5:] == ".docx":  #寻找docx文件

                        txt(j,c) #

                else:
                        pass

for i in rootdir:                  #定义函数,查找所有文件

        for parent,dirnames,filenames in os.walk(i):  

            for filename in filenames:    

                c.append(os.path.join(parent,filename))

wordt(c)

将docx另存为txt ,并且删除源文件

涉及到office中docx文档的打与另存为命令

相关参考

from win32com import client as wc
word = wc.Dispatch(‘Word.Application‘)
doc = word.Documents.Open(‘c:/test‘)
doc.SaveAs(‘c:/test.text‘, 2)
doc.Close()
word.Quit()
open(r‘c:\text‘,‘r‘)
wdFormatDocument = 0
wdFormatDocument97 = 0
wdFormatDocumentDefault = 16
wdFormatDOSText = 4
wdFormatDOSTextLineBreaks = 5
wdFormatEncodedText = 7
wdFormatFilteredHTML = 10
wdFormatFlatXML = 19
wdFormatFlatXMLMacroEnabled = 20
wdFormatFlatXMLTemplate = 21
wdFormatFlatXMLTemplateMacroEnabled = 22
wdFormatHTML = 8
wdFormatPDF = 17
wdFormatRTF = 6
wdFormatTemplate = 1
wdFormatTemplate97 = 1
wdFormatText = 2
wdFormatTextLineBreaks = 3
wdFormatUnicodeText = 7
wdFormatWebArchive = 9
wdFormatXML = 11
wdFormatXMLDocument = 12
wdFormatXMLDocumentMacroEnabled = 13
wdFormatXMLTemplate = 14
wdFormatXMLTemplateMacroEnabled = 15
wdFormatXPS = 18

over!
时间: 2024-11-05 19:43:52

python 将word另存为txt的相关文章

python处理word文件:win32com用法详解

目标:用python处理doc文件 方法:引入win32com模块 ************************************************************************** 一.安装 ************************************************************************** 首先要先下载安装win32com模块(起先在linux下装不成功,后在windows下面成功了...) 下载地址:http

python读取word表格内容(1)

1.首页介绍下word表格内容,实例如下: 每两个表格后面是一个合并的单元格 2.引入win32com模块 3.具体代码 1 #http://www.jb51.net/article/70318.htm 2 #http://www.cnblogs.com/graphics/articles/2953665.html 3 #http://shouce.jb51.net/python/ 4 import win32com,re 5 from win32com.client import Dispat

word和.txt文件转html 及pdf文件, 使用poi jsoup itext心得

word和.txt文件转html 及pdf文件, 使用poi jsoup  itext心得本人第一次写博客,有上面不足的或者需要改正的希望大家指出来,一起学习交流讨论.由于在项目中遇到了这一个问题,在网上也找了很多方法,感觉千篇一律,总有一些问题,因此总结出word转html和pdf文件使用方法.虽然poi功能不是很强大,但毕竟不依靠本地office软件,同样还有一种方式使用jacob也可以将word转html,不过这个方式要依靠本地office,而且只能在windows平台下,不支持unix系

Python操作Word批量生成文章

需要做一些会议记录.总共有多少呢?五个地点x7个月份x每月4篇=140篇.虽然不很重要,但是140篇记录完全雷同也不好.大体看了一下,此类的记录大致分为四段.于是决定每段提供四种选项,每段从四选项里随机选一项,拼凑成四段文字,存成一个文件.而且要打印出来,所以准备生成一个140页的Word文档,每页一篇. 需要用到win32com模块(下载链接:http://sourceforge.net/projects/pywin32/files/), 通过COM让Python与Word建立连接.代码如下:

python操作word(改课文格式)【最终版】

python操作word的一些方法,前面写了一些感悟,有点跑题,改了下题目,方便能搜索到.心急的可以直接拉到最后看代码,我都加了比较详细的注释. 从8.3号早上9点,到8.8号下午5点半下班,终于把这个python代码写出来了,这五天简直是废寝忘食(扯淡),每天查资料到半夜2点(其实是天太热,洗完澡又晾干就要一个多小时了,在这里吐槽下今年的夏天,2016年北京的7月份简直了,平生第一次长痱子,连去年都没用过的凉席都翻出来了). 好吧,扯得有点远了.因为工作需要,要批量修改一批rtf文件里的文字格

Python操作Word【批量生成文章】

http://www.cnblogs.com/codex/p/4668396.html 需要做一些会议记录.总共有多少呢?五个地点x7个月份x每月4篇=140篇.虽然不很重要,但是140篇记录完全雷同也不好.大体看了一下,此类的记录大致分为四段.于是决定每段提供四种选项,每段从四选项里随机选一项,拼凑成四段文字,存成一个文件.而且要打印出来,所以准备生成一个140页的Word文档,每页一篇. 需要用到win32com模块(下载链接:http://sourceforge.net/projects/

用python读取word文件里的表格信息【华为云技术分享】

在企查查查询企业信息的时候,得到了一些word文件,里面有些控股企业的数据放在表格里,需要我们将其提取出来. word文件看起来很复杂,不方便进行结构化.实际上,一个word文档中大概有这么几种类型的内容:paragraph(段落),table(表格),character(字符).我现在要解析的word文档中,基本都是段落和表格,本文主要来讲一下如何从word中解析出表格,并将表格信息进行结构化. 要想使用python解析word文件,我们可以使用包docx,首先我们需要安装它. 安装完成后,我

python获取知乎日报另存为txt文件

前言 拿来练手的,比较简单(且有bug),欢迎交流~ 功能介绍 抓取当日的知乎日报的内容,并将每篇博文另存为一个txt文件,集中放在一个文件夹下,文件夹名字为当日时间. 使用的库 re,BeautifulSoup,sys,urllib2 注意事项 1.运行环境是Linux,python2.7.x,想在win上使用直接改一下里边的命令就可以了 2.bug是在处理 “如何正确吐槽”的时候只能获取第一个(懒癌发作了) 3.直接获取(如下)内容是不可以的,知乎做了反抓取的处理 urllib2.urlop

1、Python django 框架下的word Excel TXT Image 等文件的上传

1.文件上传(input标签) (1)html代码(form表单用post方法提交) 1 <input class="btn btn-primary col-md-1" style="margin:0px 15px 25px 15px;" id="submitForm" type="button" value="提交" /> 2 <form id="picture_form&qu