利用os和pandas来合并当前目录下所有excel文件

#1、引入模块
import os
import pandas as pd

#2、取出指定目录下的全部excel文件路径
path="C:\\TEST"
dirlist=[]
for dirpath,dirname,filename in os.walk(path):
    for i in filename:
        dirlist.append(os.path.join(dirpath,i))

#3、创建一个df对象列表,并进行合并操作
dflist=[]
for i in dirlist:
    dflist.append(pd.read_excel(i))

#4、利用pd.concat函数来合并excel,涉及excel数据列数量不一致的、有空值等情况均没有影响合并效果
mydf=pd.concat(dflist)

#5、导出合并后的excel,因为此方法合并后index存在重复,可选择去除index
mydf.to_excel("mydf.xlsx",index=None)

#6、查看合并后的excel文件
print(pd.read_excel("mydf.xlsx"))

来源参考于网络

原文地址:https://www.cnblogs.com/hankleo/p/11693140.html

时间: 2024-11-08 22:57:09

利用os和pandas来合并当前目录下所有excel文件的相关文章

递归打印当前目录下的所有文件的文件名和文件大小

递归打印当前目录下的所有文件的文件名和文件大小,在ubuntu14.04下编译通过: /************************************************************************* > File Name: dirwalk.c > Author: > Mail: > Created Time: Tue 31 Mar 2015 11:56:38 AM CST ************************************

WPF 利用Process.Start()方法启动指定路径下的exe文件并传递参数接收参数

WPF 利用Process.Start()方法启动指定路径下的exe文件并传递参数接收参数 在开发中遇到这样一个需求:WPF程序A启动WPF程序B并且传递参数,WPF程序B接收参数并处理. 如何来实现这样的需求呢,网络上已经有很多的文章描述这个问题,在这里做个记录. 首先通过如下代码启动WPF客户端B: private void ActionStartClientExcute() { var address = "exe位置"; Process process = new Proces

Linux中在当前目录下查找某个文件

ZT:https://zhidao.baidu.com/question/1512088073851955780.html Linux中在当前目录下查找某个文件可以使用find命令. 1.比如在/usr/lib下查找klibc的文件,进入/usr/lib目录后,可以执行 find . -name "klibc" 说明:find命令用于查找文件,后面的"."代表当前目录,-name是find命令的参数,后面接要搜索的文件名. 2.如果不明确文件名称,可以使用通配符 f

利用os、hash模块生成目录下所有文件的md5

hashlib用于对字符串或者文件进行加密. 使用方法1: hashlib.md5('str').hexdigest() 使用MD5对str进行加密,使用hexdigest(),16进制的方式打印 使用方法2: md5 = hashlib.md5() md5.update('hello') 如果第一次执行update,那么就是对hello这个字符串进行MD5加密(注意,这里是累加,如果多次update,那么求得是累加的md5值) md5.hexdigest() 把md5对象保存的str,以16进

php简单的查找当前目录下的非法文件

<?php /** *只遍历当前目录下的文档 *@return bool */ $new = microtime(); function read_all_file($path) { if(empty($path)) { return false; } $path = rtrim($path,'/'); static $file_arr = array(); if(! is_readable($path)) { echo $path.'无权限读取文件或文件夹不存在'; return false;

C#利用NPOI生成具有精确列宽行高的Excel文件

前言 NPOI是操作Excel的神器,导出导入快如闪电, 但是SetColumnWidth函数个人感觉不会用,怎么弄都无法控制好,因为他是以字符数量去设置宽度,实际上Excel列宽还有个像素的概念,更搞不懂了 //附带SetColumnWidth的用法和注释 [csharp] view plaincopy IWorkbook hssfworkbook = new HSSFWorkbook(); ISheet sheet1 = hssfworkbook.CreateSheet("Sheet1&qu

利用PHPExcel将数据导出到xls格式的excel文件

在开发某地的经营许可证管理系统的时候需要将数据导出打excel文件,虽然一年前做某集团的ERP的时候用到过一次导入和导出,但是那时候太忙没时间写博客,一年过去了我也忘的差不多了,所以趁着今天将此次的使用写到博客中,作为以后开发的一个参考,免得再次使用的时候需要导出找资料,也给其他同行一个参考.作者:DragonDean,博客地址:http://www.cnblogs.com/dragondean/ 什么是PHPExcel? PHPExcel 是用来操作Office Excel 文档的一个PHP类

Pandas 读取超过 65536 行的 Excel 文件

Excel 文件的格式曾经发生过一次变化,在 Excel 2007 以前,使用扩展名为 .xls 格式的文件,这种文件格式是一种特定的二进制格式,最多支持 65,536 行,256 列表格.从 Excel 2007 版开始,默认采用了基于 XML 的新的文件格式 .xlsx ,支持的表格行数达到了 1,048,576,列数达到了 16,384.需要注意的是,将 .xlsx 格式的文件转换为 .xls 格式的文件时,65536 行和 256 列之后的数据都会被丢弃. Pandas 读取 Excel

列出zip文件内全部内容 当前目录下的所有文件压缩成zip格式的文件(file.zip)

[[email protected] Desktop]# zip -r image.zip ./*.jpg adding: 20161007_113743.jpg (deflated 0%) adding: 20161007_114943.jpg (deflated 0%) [[email protected] Desktop]# file image.zip image.zip: Zip archive data, at least v2.0 to extract [[email protec