ccf 目录格式转换

任务背景:

在网络上获取的ccf目录的格式是PDF,但是要进行数据分析时,PDF格式的数据是不符合要求的,因此需要将pdf格式转化为excel格式

任务目的:

将pdf格式的CCF目录转化为excel格式,并且备注上等级和所属的领域

包含的数据字段有:全称,出版商,等级,所属领域

解决过程:

1.首先先到网站上下载pdf格式的CCF目录,这个很容易获取(附件中已附上在博客中的文件可以找到)

2.利用网上的在线PDF转换网站此次试验用的是http://app.xunjiepdf.com/pdf2excel(迅捷在线PDF格式转化)

3.下载转好的文件

4.将文件中的全称和出版商两行复制下来(只包含数据),导入到filename文件中(filename为自定义文件名),因为PDF文件中的数据不是规范的excel格式,因此还需要进行数据处理。

5.运行happy.py,输入filename。

6.就能在F:/paper/ccf/filename2.xls中获得结果

7.得到的结果只是全称和出版社,关于她的等级和所属的领域还需要手动输入。用excel可以很快的完成。大部分的数据都是好的,但是有一些数据因为格式过于错乱,需要手动检查纠正。

8.附件中即是获取的结果。

以下是happy.py代码

 1 import xlrd
 2 import xlwt
 3 name = raw_input("please input the name:\n")
 4 work = xlwt.Workbook()
 5 sheet = work.add_sheet(‘test‘)
 6 data = xlrd.open_workbook("F:paper/ccf/%s.xlsx" % name)
 7 table = data.sheet_by_index(0)
 8 nrows = table.nrows
 9 ncols = table.ncols
10 row = 0
11 col = 0
12 i = 0
13 while i < nrows:
14     if table.cell(i, 1).value == ‘‘ and table.cell(i + 1, 0).value == ‘‘:
15         temp_name = table.cell(i, 0).value + ‘ ‘ + table.cell(i+2, 0).value
16         temp_organization = table.cell(i+1, 1).value
17         sheet.write(row, 0, temp_name)
18         sheet.write(row, 1, temp_organization)
19         row += 1
20         i += 3
21     else:
22         temp_name = table.cell(i, 0).value
23         temp_organization = table.cell(i, 1).value
24         sheet.write(row, 0, temp_name)
25         sheet.write(row, 1, temp_organization)
26         row += 1
27         i += 1
28 name = name + "2"
29 work.save("F:paper/ccf/%s.xls" % name)
30 del nrows
31 del ncols
时间: 2024-10-14 05:50:39

ccf 目录格式转换的相关文章

office之间的格式转换解析 如何将ppt转换成word

Office文档之间可以进行相互转换吗?这个问题问出来,很多人的第一反应就是不能,Microsoft office有不少的类型文档,针对不同的领域,有各自不同的功能,正因为他们直接的"不同",所以将格式转换变得困难.也不是没有人试过,像是复制后粘贴就是一种好方法,但是说"转换"还太勉强.下面为大家介绍:office之间的格式转换解析,如何将ppt转换成word? 步骤1,首先下一个可以转换文档格式的工具,请将下载安装软件,并点击"立即运行"在安装

扩增子分析解读3格式转换 去冗余 聚类

本节课程,需要完成扩增子分析解读1质控 实验设计 双端序列合并和2提取barcode 质控及样品拆分 切除扩增引物 先看一下扩增子分析的整体流程,从下向上逐层分析 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们提取barcode,质控及样品拆分,切除扩增引物,经历了两节课6步数据处理才拿到我们扩增的高质量目的片段(貌似基因组/RNA-Seq测序结果直接就是这个阶段了,可以直接mapping) 接下来我们将这些序列去冗余.聚类为OTU.再去除嵌合体,这样就可以获得

史林枫:C#.NET利用ffmpeg操作视频实战(格式转换,加水印 一步到位)

ffmpeg.exe是大名鼎鼎的视频处理软件,以命令行参数形式运行.网上也有很多关于ffmpeg的资料介绍.但是在用C#做实际开发时,却遇到了几个问题及注意事项,比如如何无损处理视频?如何在转换格式的同时添加水印,以提升处理效率?,ffmpeg的版本应该选择什么版本?.今天史林峰将用实战的方式来探索C#操作ffmpeg的奥秘. 关于ffmpeg的使用及其参数命令,这里就不做过多介绍了.主要以项目实战中为主. 因工作需要,笔者手头有近300部短视频需要处理,在网上找了不少工具,虽然能用,但是用起来

Window下 Qt 编译MySQL驱动(居然用到了动态库格式转换工具)

一步步在Window下开发Qt 今天开始安装MySQL,看了些关于MySQL安装的博文,方法大致相同,但是遇到的细节问题各有不同,或者没有讲全面,下面来说说个人的安装过程及遇到的问题. 1.首先下载,MySQL官网下载地址:http://www.mysql.com/downloads/installer/ 2.安装时,会提示安装.netFramework4环境,这里提供一个下载链接:http://dldx.csdn.net/fd.PHP?i=537939463366842&s=17682a852

PDF→Excel格式转换工具集锦!

1. Free PDF to Excel Converter Free PDF to Excel Converter是一个把PDF文件转换为Excel格式的多功能免费程序.它支持批量处理,同时也支持XLSX和XLS以及CSV三种输出格式你可以在它的工具栏上点击"添加PDF文件"或者"添加文件夹"来转换PDF文件.添加文件之后点击转换按钮就开始处理程序了.你也可以只点击需要处理的页面,合并所有的PDF文件到一个Excel文件.它会试图保留格式,但可能不完全成功,但是所

工具类涉及数据库连接、格式转换、文件操作、发送邮件等等

数据库连接工具类 数据库连接工具类——仅仅获得连接对象 ConnDB.javaimport java.sql.Connection; import java.sql.DriverManager; /** * 数据库连接工具类——仅仅获得连接对象 * */ public class ConnDB { private static Connection conn = null; private static final String DRIVER_NAME = "com.mysql.jdbc.Dri

MRT(MODIS Reprojection Tool)安装、影像批量拼接、重投影和格式转换

一.安装MRT(MODIS Reprojection Tool) 安装准备:检查是否安装java.exe.Java版本至少为Java 2 Runtime Environment version 1.5或者是Java 2 SDK version 1.5或者更高的版本.在Windows平台中可以通过开始/搜索并输入java.exe来检查自己的电脑是否安装有java,也可以不检查直接重新安装一份. 解压安装包MRT_download_<platform>.zip.包含四个文件:mrt_install

PDF文件格式转换攻略:PDF格式转换图片格式

关于PDF文件格式的转换大家有了解多少吗?就比如将PDF格式转换成图片格式,可能之前大家对于PDF件大家都有了解到,办公中我们经常遇到过.现在小编在这里教大家如何将PDF格式转换成图片格式,有兴趣的伙伴可以学着尝试一下! 1.操作之前可以将转换成图片格式的PDF文件另存到电脑桌面上,这样便于在后面的操作. 2.打开PDF转换器进入到操作的页面,在操作页面中可以选择到"PDF转成其他文件"栏目下的功能"文件转换图片",这一步完成之后,然后继续进行下一步操作.3.这时候

CAD转JPG格式,转换图片可以非常简单

CAD转JPG格式,转换图片可以非常简单.小伙伴们在日常的工作中,长期处理各种CAD图纸,常常会需要对CAD图纸进行各种格式转换.CAD转JPG图片格式就是经常会遇到的问题.小编今天就给大家具体演示一下.操作步骤如下:步骤一:安装运行需要的CAD转换器1.首先在浏览器里搜索迅捷CAD转换器安装到电脑端:2.运行迅捷CAD转换器,软件的左侧依次有各种转换功能选项:CAD版本转换.CAD转PDF.CAD转图片.PDF转CAD.DWG.DXF互转.CAD转DWF. 步骤二:选择"CAD转图片"