打开和写入word文档

一. 使用win32读取word内容

# -*- coding: utf-8 -*-

from win32com import client as wc

def readDocx2():
    word = wc.Dispatch(‘Word.Application‘)                                        # 使用WORD应用程序
    word.Visible = 0                                                              # 不打开界面

    my_worddoc = word.Documents.Open(u‘新建文本文档.docx‘)                          # 打开word文档
    paragraphs = my_worddoc.Paragraphs.Count                                      # 计算段落数
    for i in range(paragraphs):
        my_pr = my_worddoc.Paragraphs[i].Range                                    # 读取每段并打印
        print my_pr.text
    my_worddoc.Close()
readDocx2()

二.使用模块docx读取word内容

# -*- coding: utf-8 -*-import docx

def read_docx(filename):                             #filename为文件地址
    doc = docx.Document(filename)                    #打开docx文档
    fulltext = []                                    #创建空列表
    for para in doc.paragraphs:                      #遍历所有段落的文字内容
        fulltext.append(para.text)                   #将所有文字内容添加到列表fulltext中
    return ‘\n‘.join(fulltext)                       #进行分段,返回原文

a = read_docx(u‘新建文本文档.docx‘)
print a                                              #打印出来

三.写入word文档

# -*- coding: utf-8 -*-from docx import Document
from docx.shared import Inches

document = Document()

document.add_heading(‘This is a Title‘, 0)                            #添加题目

p = document.add_paragraph(‘This is a paragraph‘)                     #添加段落内容
p.add_run(‘bold‘).bold = True                                         #设置粗体和格式
p.add_run(‘ and some ‘)
p.add_run(‘italic.‘).italic = True

document.add_heading(‘This is a heading with level1‘, level=1)        #级别为1的小标题
document.add_paragraph(‘Intense quote‘, style=‘IntenseQuote‘)         #添加段落内容

document.add_paragraph(
    ‘first item in unordered list‘, style=‘ListBullet‘                #添加段落内容并设置格式,不带序号
)
document.add_paragraph(
    ‘first item in ordered list‘, style=‘ListNumber‘                  #添加段落内容并设置格式,带有序号
)
#设置文本内容text = ‘‘‘ aaaa                                                     bbb ccc ddd‘‘‘ 
document.add_paragraph(text)                                          #添加大量文本内容...

document.add_page_break()

document.save(‘demo.docx‘)                                            #保存路径...
时间: 2024-08-24 15:57:51

打开和写入word文档的相关文章

[php]在PHP中读取和写入WORD文档的代码

测试平台windows 使用的windows的com主键. 1 <? 2 // 建立一个指向新COM组件的索引 3 $word = new COM("word.application") or die("Can't start Word!"); 4 // 显示目前正在使用的Word的版本号 5 //echo "Loading Word, v. {$word->Version}<br>"; 6 // 把它的可见性设置为0(假

基于C#.NET的动态Word文档生成及数据填充研究

利用C#.NET设计的管理信息系统应用非常广泛,但其报表往往是利用水晶报表或其它工具形成固定式报表,这样不便于修改和电子文档的保存及传递,如果能将输出结果写入到Word文档中这样就解决了这个问题.现从以下几个方面介绍如何利用C#.NET来控制Word文档的操作.1 利用C#.NET生成和设置Word文档我们用VS2008中的C#.NET来实现的,所以要安装好VS2008.在编程之前必须从“项目”菜单上“添加引用”对话框的“COM”选硕卡中添加对类型库的引用,并在程序首部加入“usingWord;

处理Word文档

利用python-docx模块,Python可以创建和修改Word文档,它带有.docx文件扩展名.运行pip install python-docx,可以安装该模块. 在导入pytho-docx模块时,需要执行import docx,而不是import python-docx. 和纯文本相比,.docx文件有很多结构.这些结构在python-docx中用3种不同的类型来表示.在最高一层,Document对象表示整个文档.Document对象包含一个Paragraph对象的列表,表示文档中的段落

NPOI读写Excel表格、Word文档

NPOI是从POI移植过来的.NET版本,专门对Word.Excel进行读写操作的一个开源项目 下面就试着怎么用我们的C#来进行读写操作,我现在用的Office版本是2016 我们首先通过Nuget把NPOI引入到我们的项目中 1.读取Excel表格 using(FileStream fs=new FileStream(@"C:\Users\BIDIANQING\Desktop\1.xlsx", FileMode.Open,FileAccess.Read)) { XSSFWorkboo

将图片和表单数据变为word 文档

2 ,将图片和表单数据变为word 文档 (承接上一篇)  一开始采用的技术为poi  ,后来发现非常不好行不通 网上poi 将图片和表单数据变为word 文档  技术链接    https://blog.csdn.net/MatheoGao/article/details/79417190 为什么不用,因为发现工具类中 String blipId = getAllPictures().get(id).getPackageRelationship() .getId(); 此.getPackage

word 文档导出 (freemaker+jacob)--java开发

工作中终于遇到了 需要导出word文旦的需求了.由于以前没有操作过,所以就先百度下了,基本上是:博客园,简书,CDSN,这几大机构的相关帖子比较多,然后花了2周时间 才初步弄懂.  学习顺序: 第一阶段 1,.首先 是 先了解 java 通过什么方式 来操作word的导出工作.就有了下面这个帖子了: java 操作 word 的方法 :https://www.cnblogs.com/lcngu/p/5247179.html .新手可以先看看了解下. 2. 根据需求:操作word很复杂: 1.有图

c#中操作word文档-一、模板方式写入

转载自:http://blog.csdn.net/fujie724/article/details/5443322 适合模板写入 今天正好有人问我,怎么生成一个报表式的Word文档. 就是文字的样式和位置相对固定不变,只是里面的内容从数据中读取. 我觉得类似这种的一般用第三方报表来做比较简便.但既然要求了Word,只好硬着头皮来. 网上的方法大多数都是从一个GridView或表中获得数据后向Word中添加一个表格. 但不方便实现下面的效果(图1).(以下插图可能需要CSDN用户登录后才能看到)

WebBrowser打开Word文档的一些注意事项

WebBrowser打开Word文档的一些注意事项 分类: C#word2010-03-31 21:26 5640人阅读 评论(3) 收藏 举报 webbrowser文档browser工具objectsql server 2009年09月27日 星期日 17:37 忙乎了多日,终于将WebBrowser中Word工具栏中搞定 在题库管理系统中,需要将试题显示出来,并进行编辑.于是,每道题都存储为一个Word文件,并保存在SQL Server中,在浏览试题库时,用WebBrowser控件显示试题是

&nbsp; word文档打开后,页眉下老有一条线

解决方法 快速删除页眉横线 方法一:双击页眉区域,出现页眉编辑虚线框,在菜单"编辑"-"清除"下找到"格式"选项,单击,则页眉中的横线消失,只留下文字信息.想要恢复横线,点击"编辑"菜单的"撤销键入"项可. 方法二.清除边框和底纹法永久删除 ①同样"视图"-->"页眉和页脚"按钮,进入页眉页脚编辑模式: ②然后进入菜单栏的"格式"中的&quo