python读取word表格内容(1)

1.首页介绍下word表格内容,实例如下: 每两个表格后面是一个合并的单元格

2.引入win32com模块

3.具体代码

 1 #http://www.jb51.net/article/70318.htm
 2 #http://www.cnblogs.com/graphics/articles/2953665.html
 3 #http://shouce.jb51.net/python/
 4 import win32com,re
 5 from win32com.client import Dispatch,constants
 6
 7
 8 word=win32com.client.Dispatch(‘word.application‘)
 9 ‘‘‘
10 设置Word的可见性visible,默认情况下,你看不到Word程序;然后设置Word的警告信息是否出现,默认也是不出现,这样你在使用python控制Word的时候不会弹出Word的警告信息。
11 ‘‘‘
12 word.displayalerts=0
13 word.visible=0
14 countdoc=word.Documents.Count
15 print(countdoc)
16 doc=word.Documents.Open(r‘C:\Users\Administrator\Desktop\test\文档一\1.doc‘)
17 #doc.SaveAs(r‘C:\Users\Administrator\Desktop\test\文档一\1.txt‘)
18 ‘‘‘
19 t=doc.Tables[0]
20 #print(type(t))
21 tt=str(t)
22 #print(type(tt))
23 #print("")
24 #分割字符串
25 strs=tt.split(‘‘)
26 print(strs[5])
27 ‘‘‘
28 i=0
29 while i<500:
30     t=doc.Tables[i]
31     tt=str(t)
32     strs=tt.split(‘‘)
33     print(strs[5])
34     i=i+1
35
36 doc.Close()
37 word.Quit()

pythonword1

4.遇见的问题

1)。打开word总提示错误。原因是我Documents和Open首字母小写了

2)。

我是直接把表格获取的对象转为字符串来处理

时间: 2024-08-08 09:37:12

python读取word表格内容(1)的相关文章

python读取excel表格生成sql语句 第一版

由于单位设计数据库表·,都用sql.不知道什么原因不用 powerdesign或者ermaster工具,建表很痛苦  作为程序猿当然要想办法解决,用Python写一个程序解决 需要用到 xlrd linux下 sudo pip install xlrd 主要是适用于db2数据库 excel 表结构 其中 number是不正确的字段类型 不知道同事为啥这么设置.这里程序里有纠错,这个程序就是将sql语句拼好. __author__ = 'c3t' # coding:utf-8 import xlr

Python:读取Excel表格时出现的u&#39;\u51c6’ 无法正确显示汉字

读取Excel后,想显示其中一行的元素,结果读出来是这样[u'\u51c6\u8003\u8bc1\u53f7', u'\u8003\u751f\u59d3\u540d'],始终不显示正常的汉字 依照网上的方法直接print()即可输出,试验后发现确实可以,不过一次只能输出一个元素,多余一个元素则依旧 后查找得知解决方法:需要用到json库 1 import json 2 #……文件的读取略去 3 #json.dumps(A).decode("unicode-escape") 4 #这

用python读取word文件里的表格信息【华为云技术分享】

在企查查查询企业信息的时候,得到了一些word文件,里面有些控股企业的数据放在表格里,需要我们将其提取出来. word文件看起来很复杂,不方便进行结构化.实际上,一个word文档中大概有这么几种类型的内容:paragraph(段落),table(表格),character(字符).我现在要解析的word文档中,基本都是段落和表格,本文主要来讲一下如何从word中解析出表格,并将表格信息进行结构化. 要想使用python解析word文件,我们可以使用包docx,首先我们需要安装它. 安装完成后,我

python读取word文档,插入mysql数据库实例

表格内容如下: 1.实现批量导入word文档,取文档标题中的数字作为编号 2.除取上面打钩的内容需要匹配出来入库入库,其他内容全部直接入库mysql # wuyanfeng# -*- coding:utf-8 -*-# 读取docx中的文本代码示例import docximport pymysqlimport reimport os # 创建数据库链接conn = pymysql.connect( host='rm-bp1vu5d84dg12c6d59o.mysql.rds.aliyuncs.c

python读取word中的段落、表、图

读取文本.图.表.解压信息 import docx import zipfile import os import shutil '''读取word中的文本''' def gettxt(): file=docx.Document("gao.docx") print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段 #输出每一段的内容 # for para in file.paragraphs: # print(par

python读取excle表格_xlrd模块

python读取excle文件需要安装xlrd 1 #python读取excle文件需要安装xlrd 2 import xlrd 3 #打开一个excle文件 4 file=xlrd.open_workbook('E:\learning\list.xlsx') 5 #打开excle文件中的一个表单 6 a=file.sheets()[1] 7 # table = data.sheet_by_index(0) #通过索引顺序获取 8 # table = data.sheet_by_name(u'S

python读取word文档中的表格内容

import docx fn = r'D:\长恨歌.docx' doc = docx.Document(fn) # 按段落读取全部数据 for paragraph in doc.paragraphs: print(paragraph.text) # 按表格读取全部数据 for table in doc.tables: for row in table.rows: for cell in row.cells: print(cell.text) table_num = len(doc.tables)

python读取excel表格的数据

1.在Windows命令行中安装第三方模块xlrd,先切到python安装目录(Python34),然后切到Scripts,然后输入命令easy_install xlrd按回车进行安装 安装完成 2.新建一个excel表,然后保存,造数据 3.编写python脚本 #utf-8 import xlrd     #导入第三方模块xlrd excel = xlrd.open_workbook('C:\\表格.xlsx')       #打开目标表格文件(填写路径) sheet = excel.she

Python读取excel表格时,意外的深入理解info字典问题

import xlrd import re def excel_table_byindex(): data = xlrd.open_workbook('crawlingPhonePrice_new.xlsx') #打开一个excel表格,表格有手机名,价格 table=data.sheets()[0] nrows=table.nrows ncols=table.ncols colnames=table.row_values(0) #print(colnames) info={} #存放键值对,手