python 实现endnote下载的pdf文件的整理

endnote下载的文件放在一个pdf文件夹中的一堆乱序数字的文件夹中如图

现在老板要求要把下载下来的文件发给他，但一个个拷出来感觉有些蛋疼，于是就想到了python，通过查阅资料，完美实现了这个整理的功能，果然是python大法好2333333333333

最终效果：

本人python菜鸟，写的不好的地方，请见谅

#--------------------【classify.py】------------------
#       author      :   zhyh2010
#       date        :   201505113
#       target      ：  整理endnote自动下载的pdf文件，使其移动到一个文件夹中
#-------------------------【end】--------------------------

import os.path
import shutil

#-------------------------【class classify】--------------------------
#    para : curpath         当前路径
#           extension       扩展名
#           target_dir      目标存储文件夹
#       三个成员变量都在 init 中被初始化， 修改 init 中这三个参数就可以实现函数扩展了
#-------------------------【class classify  end】--------------------------
class classify:
    curpath = ‘‘
    extension = ‘‘
    target_dir = ‘‘

    def __init__(self):
        self.curpath = os.getcwd()
        self.extension = ‘.pdf‘
        self.target_dir = ‘endnote pdf‘

    #-------------------------【classify_file】--------------------------
    #    target:   遍历 path 文件路径， 并将文件夹中的 pdf  文件移动至 相应目录中去
    #-------------------------【classify_file  end】--------------------------
    def classify_file(self):
        extension = self.extension
        path = self.curpath
        if not os.path.isdir(path):         # 判断是否为路径
            print(‘error! it is not a dir‘)
            return

        self.makedir()
        for root, dirs, list in os.walk(path):
            for file in list:
                if file.endswith(extension):
                    print(‘moving\t‘ + file + ‘\ting...............‘)
                    try:
                        self.movefiles(os.path.join(root, file))
                    except:
                        continue
        print(‘-------------------done-----------------‘)

    #-------------------------【makedir】--------------------------
    #    target:   创建目标文件夹
    #-------------------------【makedir  end】---------------------
    def makedir(self):
        target_dir = self.target_dir
        if not os.path.exists(target_dir):
            os.mkdir(target_dir)

    #-------------------------【movefiles】--------------------------
    #    target:   移动文件 到 file 目录下
    #-------------------------【movefiles  end】---------------------
    def movefiles(self, file):
        target_dir = self.target_dir
        shutil.copy(file, target_dir)

#instance = classify  缺少() 没有初始化self
instance = classify()
instance.classify_file()

参考资料

1.Python笔记——类定义

2.Python文件操作及文件夹遍历

3.Python的startswith与endswith函数

4.Python shutil模块

5python判断文件和文件夹是否存在

6try..except

时间： 2024-11-08 03:13:50

python 实现endnote下载的pdf文件的整理的相关文章

用apache做为代理下载本地pdf文件

有一些公司会用apache做为代理,下载服务器上的pdf文件.以下是apache做为代理的配置一. 环境 centos6.5 192.168.69.3 二. yum安装apache 服务 [[email protected] ~]$ rpm -qa httpd //查看是否有rpm包安装的apache服务httpd-2.2.15-60.el6.centos.5.x86_64 [[email protected] ~]$ rpm -e httpd-2.2.15-60.el6.centos

python server.py下载dns上文件

1.对需要运行server.py脚本的服务器进行配置 2.在服务器上,执行python server.py -f fielname 3.在客户端上,运行sh client.sh dns.testdomain.com 4.这时你应该看到client和server开始产生base64的调试输出.client会把base64的编码写到本地文件中,同时在结束传输时解码 server.py下载地址 https://github.com/breenmachine/dnsftp client.sh脚本 #!b

使用Python自定义页数分割PDF文件

需求: 环境准备: 1.Pyhon3以上+PyPDF2 2.代码与需要分割的PDF放在同一目录下代码如下(简版): from PyPDF2 import PdfFileReader, PdfFileWriter def pdf_splitter(path,start,end): fname = os.path.splitext(os.path.basename(path))[0] pdf = PdfFileReader(path) pdf_writer = PdfFileWriter() ou

php如何利用python实现对pdf文件的操作（读写、合并分割）

php如何利用python实现对pdf文件的操作需求:在PHP里实现了把8.pdf的前4页pdf文件截取出来生成新的pdf文件. 详细步骤如下: 1. 安装python第三方库PyPDF2 前提:python必须是3.x版本以上,必要时需要升级pip3,命令如下:pip3 install --upgrade pipPyPDF 自 2010年 12月开始就不在更新了,PyPDF2 接棒 PyPDF, 在此使用PyPDF2. 安装命令:pip install PyPDF2 2.编写python脚本

提取论文标题并自动重命名pdf文件

在我们确定一个研究课题之后,我们总是会先下载一堆相关的paper,看看这个领域现在已经做到一个什么地步,也看看别人是怎么做的,后面自己写paper的时候可以参考参考.当我们把相关的文章都下载到一个文件夹之后,有一个问题,一般我们从IEEE或是ACM相关站点下载的PDF文件的文件名不是相应文章的标题.我们希望文件名尽量能够反映文件的主要内容,文章的标题显然是最能概括文张内容的.昨天上午,一个小时的时间就花在把下载下来的文件重命名上了.因为太费时间,想自己写个简单的小程序来完成这个工作.上网一找,嗬

在线浏览pdf文件，pdfobject的简单使用

该js插件,官网有详细的使用教程(网址:http://www.pdfobject.com/examples/).打开里面的例子后,查看新打开页面,打开并查看该页面的源代码. 需要的材料: 1.PDFobject.js(下载地址:http://www.pdfobject.com/downloads/) 废话不多说(好像没说几个词).直接上代码了.以下代码讲会在浏览器里全屏显示 <html> <head> <title>PDFObject example</title

Android 如何本地加载pdf文件

大部分app打开pdf文件是通过intent调起手机中能打开pdf文件的工具,来查看pdf文件,如果需求是,用户在app内下载好pdf文件后,不通过第三方的工具,本地打开. 这样的需求要怎么实现呢?上网查了一些资料,发现了一个很好用PDF开源库. 使用起来也很简单,首先添加PDFView的引用 compile 'com.github.barteksc:android-pdf-viewer:2.4.0' 布局中引用PdfView <LinearLayout xmlns:android="ht

提取PDF文件中的文本信息

转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/43527755 我们从网上下载的PDF文件有的是加密处理过的,无法复制其中的内容,对于这类文件的内容提取可以通过该工具实现 PDF加密 PDF文件经过加密处理之后是无法简单的复制的,PDF文件的属性也如下图所示: 工具的使用方法软件的目录结构如下图: lib文件夹下是程序的运行环境和代码: pdf文件夹是需要转化的pdf文件所在的文件夹: txt文件夹是转化后生成的txt文件所

加密PDF文件的打印问题

工作中遇到网上下载的PDF文件加密,并且不能打印解决方法: 1.解密: 去网站下载解密软件,1M左右:http://www.onlinedown.net/soft/19939.htm 直接解压,运行 2.打印建议用谷歌浏览器直接打开PDF文件,就可以打印了,也可以调整纸张大小. 3.错误须知: 想把PDF文件转换成word文档,有网上在线转换的,亲测就迅捷的转换能用,但是还是有数据丢失的问题. 在线转换地址:http://app.xunjiepdf.com/pdf2word 若要转换了自己