如何用Python输出PPT中的文字信息

在这里,会用到win32com模块

模块下载地址:http://sourceforge.net/projects/pywin32/files/pywin32/

代码如下:

import win32com
from win32com.client import Dispatch, constants
ppt = win32com.client.Dispatch(‘PowerPoint.Application‘)
ppt.Visible = 1
pptSel = ppt.Presentations.Open(r"C:\Users\Victor\Desktop\1.ppt")
win32com.client.gencache.EnsureDispatch(‘PowerPoint.Application‘)

f = file(r"C:\Users\Victor\Desktop\1.txt","w")
slide_count = pptSel.Slides.Count
for i in range(1,slide_count + 1):
    shape_count = pptSel.Slides(i).Shapes.Count
    print shape_count
    for j in range(1,shape_count + 1):
        if pptSel.Slides(i).Shapes(j).HasTextFrame:
            s = pptSel.Slides(i).Shapes(j).TextFrame.TextRange.Text
            f.write(s.encode(‘utf-8‘) + "\n")
f.close()
ppt.Quit()

PS:

1> 在打开文件的时候,刚开始写的是pptSel = ppt.Presentations.Open("C:\Users\Victor\Desktop\1.ppt"),报如下错误:

>>> pptSel=ppt.Presentations.Open("C:\Users\Victor\Desktop\1.ppt")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<COMObject <unknown>>", line 3, in Open
pywintypes.com_error: (-2147352567, ‘\xb7\xa2\xc9\xfa\xd2\xe2\xcd\xe2\xa1\xa3‘,
(0, None, None, None, 0, -2147024773), None)

错误的主要原因为路径中的反斜杠无法自动识别。

2> 该程序段来自 http://www.sharejs.com/codes/python/8145

时间: 2024-11-05 12:20:27

如何用Python输出PPT中的文字信息的相关文章

python识别图中的文字(ocr)

环境:我是用的是pycharm ,在pycharm中安装第三方插件,但是在安装PIL是遇到问题 1.安装 pytesseract 2.在网上下载PIL https://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow 在你的python script文件中打开cmd 输入pip install 你下载的pillow文件名 和https://github.com/UB-Mannheim/tesseract/wiki-->直接安装64位 3.配置tesseract

【转】Revit二次开发——读取cad中的文字信息

Revit读取cad的文字信息需要借助Teigha的开源dll,在程序中添加下图中红色框的dll文件的引用,其他的dll文件全部放在同一个文件夹中即可,运行的时候,会自动把这些dll文件全部复制到bin文件当中,同时,在Revit中运行插件,Revit也会自动加载这些dll文件. 以下是关键方法,在Revit里读取cad文字信息,图层信息,几何信息等. using System; using System.Collections.Generic; using System.Linq; using

用poi替换ppt中的文字和图片

try {            // 获取PPT文件             String pptModelPath =ConfigReadUtil.getInstance().getConfigItem("ppt_path");  //获取路径            FileInputStream is = new FileInputStream(pptModelPath+"2.pptx");  //读pptx存放的路径 XMLSlideShow ppt = n

如何用python提取Excel中指定列名的数据

#coding=utf-8 import xlrd,chardet,traceback #根据列名获取相应序号 def getColumnIndex(table,columnName): columnIndex=None for i in range(table.ncols): if(table.cell_value(0,i)==columnName): columnIndex=i break return columnIndex #根据Excel中sheet名称读取数据 def readExc

如何用python将txt中的package批量安装

第一步:cd 到目标路径 第二步:新建一个requirement.txt文档,将所有要下载的包一一罗列出来(需要指定版本的话,可以用==表明) 第三步:输入命令  pip install -r requirements.txt 以上操作即可完成. 上面几步操作是批量安装包,pip同时支持批量导出. pip list 只是在cmd窗口列出所安装的所有包 pip freeze >requirements.txt 将所有的包列入requirements.txt中. 原文地址:https://www.c

如何用Python输出一个斐波那契Fibonacci数列

a,b = 0, 1 while b<100: print (b), a, b = b, a+b 原文地址:https://www.cnblogs.com/apollo1616/p/9776116.html

如何用JavaScript提取URL中的用户信息

比如传递的URL为:http://localhost//a.html?username=aa&password=12,如何用JavaScript提取其中的username和password数据呢?具体方法参考[1]如下所示: 1 function getQueryStringArgs() { 2 // 取得查询字符串并去掉开头的问好 3 var qs = (location.search.length > 0 ? location.search.substring(1) : "&q

PPT小技巧:PPT中怎么给文字添加描边效果

很多时候在色彩丰富的PPT中由于背景颜色的关系,文字往往并不能清晰呈现,这个时候我们需要给PPT中的文字添加描边效果,这样突出需要显示的文字了.想必大家一般给文字添加描边效果都是在PS中进行操作的吧,今天给大家安利一个PPT小技巧,在PPT中给文字添加描边效果.第一步:打开PPT文件新建一个空白页面.第二步:插入文本框,并在上方输入"1,2,3".第三步:点击绘图工具.第四步:找到导航栏上的"文本轮廓"并点击.第五步:调整文字的描边颜色.第六步:调整文字的描边粗细.

Python计算图形中三角形数量

看一个论坛里的.说如何用python计算图形中三角形的数量. 图如下: 论坛那位兄弟是先把所有的边上的点放到一个list里面. 然后去生成相关组合. 再去判断点的位置正确与否. 所有的点组合list: ['abh','acgi','adfj','aek','bcde','efgh','hijk'] 下图中三个框分别为三条线上的点集合.由图可知,要构成三角形必须三个集合两两之间取 交集得到相应的点. 任意两个集合的交集.为一个点. 用itertools的组合方法生成三个集合的组合 再两个之间取交集