将word文本导入python

之前使用python处理excel比较多,无所不能的python当然也可以处理word啦。
docx这个库我也是刚刚接触,那就一点点学吧
import docx可能会出现报错,试试pip install python-docx,应该就能解决了

如何迈出最难的第一步,把word导入python?
其实很简单,以下是代码:

import docx,os

#将word文本导入
def getText(filename):
    doc=docx.Document(filename)

    fullText=[]
    for para in doc.paragraphs:
        fullText.append(para.text)

    return ‘\n\n‘.join(fullText)

if __name__=="__main__":
    filename1=r‘/Users/fangluping/Desktop/数据分析笔试试题/长亮数据-咨询部笔试题目-附件/03.docx‘
    text1=getText(filename1)
    print(text1)

原文地址:https://blog.51cto.com/14534896/2475259

时间: 2024-11-08 09:10:33

将word文本导入python的相关文章

数据从txt文本导入python

机器学习实战 p21 源代码: def file2matrix(filename):    fr = open(filename)    numberOfLines = len(fr.readlines())         #get the number of lines in the file    returnMat = zeros((numberOfLines,3))        #prepare matrix to return    classLabelVector = []   

1.1.26 word内容导入PPT

1.在开始菜单栏选择[视图]>[大纲].进入大纲后,对文本设置大纲级别. 2.设置好后,在[word选项]>下拉菜单中找到[不在功能区命令]>选择[发送到PPT]. 1.1.26 word内容导入PPT 原文地址:https://www.cnblogs.com/baixu/p/10463928.html

Java 添加Word文本框

在Word中,文本框是指一种可移动.可调节大小的文字或图形容器.我们可以向文本框中添加文字.图片.表格等对象,下面,将通过Java编程来实现添加以上对象到Word文本框. 使用工具:Free Spire.Doc for Java (免费版) Jar文件获取及导入: 方法1:通过官网下载获取jar包.下载后,解压文件,并将lib文件夹下的Spire.Doc.jar文件导入Java程序.(如下图) 方法2:通过maven仓库安装导入. Java代码示例 import com.spire.doc.*;

在导入python(tab)模块时报错

在导入python的模块时会报错: 配置文件: #!/usr/bin/env python # python Tab file import sys import readline import rlcompleter import atexit import os readline.parse_and_bind('tab:complete') histfile = os.path.join(os.environ['HOME'], '.pythonhistory') try:     readl

Excel自文本导入内容时如何做到单元格内换行

前言:今天在处理数据的时候,在数据库中用到了\n换行符号,目的是在同表格内做到数据多行显示,比如  字段名1  字段名2  字段名3  1 数据一行 数据二行 数据三行 例子是在sql查询后的结果   2 例子如上  数据未导出  本来在sql查询后是如此显示的,但是后来导出文本格式,Excel自文本导入内容时就会报错,那么问题来了, 如何做到Excel自文本导入内容时如何做到单元格内换行? 正文:在网上找了很多例子,其中有位前辈讲的很有道理,原话如下: excel实现自动换行的两个必要条件1.

好用的支持PDF转Word文本的工具

我们都知道,借助PDF转换成Word转换器的帮助,可以非常轻松地实现PDF转换成为Word的需求.但是网 上那么多的转换器,你知道哪个好用么?现在的时代讲得就是方便和快捷!快速易操作才是王道. 现在网上那么多的PDF转Word转换器,那么到底哪个PDF转换成Word转换器好呢?国内知名的迅捷PDF转换 成Word转换器近期给了答案:全面升级提升转换效率.支持高质量精准解析和转换.多功能PDF转换功能 涵括八大转换模式,目前迅捷PDF转换成Word转换器已经不再仅仅局限于普通的PDF转换Word的

[leetcode]Word Ladder II @ Python

[leetcode]Word Ladder II @ Python 原题地址:http://oj.leetcode.com/problems/word-ladder-ii/ 参考文献:http://blog.csdn.net/doc_sgl/article/details/13341405   http://chaoren.is-programmer.com/ 题意:给定start单词,end单词,以及一个dict字典.要求找出start到end的所有最短路径,路径上的每个单词都要出现在dict

使用pl/sql的文本导入器时如何设置主键自增长

在使用文本导入器批量导入数据时,如果需要设置主键自增长,可以先创建一个序列: create sequence SEQ_Userinf start with 1 increment by 1nomaxvaluenominvaluenocache; 然后在导入时设置主键字段的sql函数为:SEQ_Userinf.nextval就可以了.

时尚版在线Word文本转皮肤转换器

假如我们能够将PDF文件转换成为更常见的图片格式,那么就可以在无需安装额外PDF阅读工具的情况下 ,轻松打开并阅读其中的内容了. 从网络上下载的普通PDF转换成Word转换器,这部分PDF转换器本身的功能非常单一,尤其是针对PDF文件 内容的识别技术相对落后,因此其实际转换的效果并不出色.甚至在某些情况下,由于软件本身解析技 术上的落后,还很有可能出现转换之后的Word文件内容乱码的情况发生. 图文混合PDF如何转换成Word是考验PDF转换器功能的一个关卡.优秀的PDF转换成Word转换器其核