Python实现自动处理表格,让你拥有更多的自由时间!

相信有不少朋友日常工作会用到 Excel 处理各式表格文件,更有甚者可能要花大把时间来做繁琐耗时的表格整理工作。最近有朋友问可否编程来减轻表格整理工作量,今儿我们就通过实例来实现 Python 对表格的自动化整理。

首先我们有这么一份数据表 source.csv:

我们要做的是从上表中提取数据,来生成一份符合以下要求的表格:

  1. 按照以下分组名单 group.xls 来整理数据表中的数据:

  2. 最终要展现的数据项:

  3. 其中“K数据/60”为数据表中的“数据K”/60后保留的2位小数

我们先看手工 Excel 如何处理以上需求:要在 source.csv 数据表中读取读取每条数据,放入 group.xls 匹配的分组成员中,最后筛选需要的数据项,再对特定的 “数据K”进行运算处理。

那么 Python 又将如何操作呢?这里我们要用到功能强大的 pandas 库。

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

pandas 百度百科

首先导入 pandas 库,通过相关的函数读取 csv 和 xls 表格内容:

import pandas as pd
# 读取 group.xls 分组信息
group = pd.read_excel("group.xls",header=None)
group.columns=["分组","角色"]
print(group)
# 读取 source.csv 获取所有成员数据
source = pd.read_csv("source.csv")
print(source)

我们可以首先对 source.csv 中的数据项进行筛选,需要的数据项有“角色”、“编号”、“数据B”、“数据C”、“数据D”和“数据K”:

# 通过 iloc[:,[列坐标]] 来定位需要的各列数据
filter_merge = source.iloc[:,[0,2,4,5,6,13]]
print(filter_merge)

接下来是根据分组角色来匹配角色数据,注意到 group.xls 和 source.csv 共有“角色”一项,我们可以通过此项将两个表格融合从而形成匹配填充的效果。

combine = pd.merge(group,filter_merge,on="角色")

接下来我们在第二列插入运算后的“数据K/60”:

combine.insert(1,"数据K/60",round(filter_merge["数据K"]/60,2))

最终,我们将生成的数据格式写入新的 xlsx 表格中:

combine.to_excel(excel_writer="result.xlsx",index=False)

最终自动生成的表格如下:

以上便是 Excel 表格整理的 Python 代码简单实现,在操作过程中也遇到几个问题贴在这里供大家参考:

  1. 导入 pandas 时可能会报错:

    解决:根据报错信息安装需要的相关模块

  2. 要进行表格整理的电脑为公司电脑、无法连接外网下载 Python

    解决:

    https://blog.csdn.net/sundan93/article/details/62888068

    参照以上链接,先在外网电脑下载 Python 安装文件以及相关的模块安装文件,拷贝到无网络电脑进行安装

  3. 以上表格整理的实例在现实工作有参考意义么:

    回答:文中表格的原型是一份员工工作记录,根据人员分组进行相关的数据统计。类似的分组统计成员数据都可以根据此简单 Python 模版来实现。

源代码:https://pan.baidu.com/s/1ro4lUaRtRb86Lf49LSjRBA (权当一个参考和提示,自行搜索尝试实现才能真正掌握哈,有问题欢迎留言反馈~)

原文地址:https://www.cnblogs.com/chengxyuan/p/12215706.html

时间: 2024-10-15 23:26:46

Python实现自动处理表格,让你拥有更多的自由时间!的相关文章

python读取excel表格生成sql语句 第一版

由于单位设计数据库表·,都用sql.不知道什么原因不用 powerdesign或者ermaster工具,建表很痛苦  作为程序猿当然要想办法解决,用Python写一个程序解决 需要用到 xlrd linux下 sudo pip install xlrd 主要是适用于db2数据库 excel 表结构 其中 number是不正确的字段类型 不知道同事为啥这么设置.这里程序里有纠错,这个程序就是将sql语句拼好. __author__ = 'c3t' # coding:utf-8 import xlr

python 操作excel表格

Python 操作excel 表格 #coding=utf-8 import xlsxwriter #1.创建excel 对象 work = xlsxwriter.Workbook('hello.xlsk')#在当前目录下创建一个Excel文件 #2. 创建表格 worksheet = work.add_worksheet('int') #3.写入内容 title_index = ["A","B","C","D","

lsof 拥有更多的功能

lsof 拥有更多的功能# lsof -i 看系统中有哪些开放的端口,哪些进程.用户在使用它们,比 netstat -lptu 的输出详细. # lsof -i 4  查看IPv4类型的进程COMMAND    PID        USER   FD   TYPE DEVICE SIZE NODE NAMEexim4     2213 Debian-exim    4u  IPv4   4844       TCP *:smtp (LISTEN)dhclient3 2306        ro

【转】python操作excel表格(xlrd/xlwt)

[转]python操作excel表格(xlrd/xlwt) 最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异,而且不太能满足需求,不过经过一番对源码的"研究"(用此一词让我觉得颇有成就感)之后,基本解决了日常所需.主要记录使用过程的常见问题及解决. python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库.可从这里下载https://pyp

Python:读取Excel表格时出现的u'\u51c6’ 无法正确显示汉字

读取Excel后,想显示其中一行的元素,结果读出来是这样[u'\u51c6\u8003\u8bc1\u53f7', u'\u8003\u751f\u59d3\u540d'],始终不显示正常的汉字 依照网上的方法直接print()即可输出,试验后发现确实可以,不过一次只能输出一个元素,多余一个元素则依旧 后查找得知解决方法:需要用到json库 1 import json 2 #……文件的读取略去 3 #json.dumps(A).decode("unicode-escape") 4 #这

桌面支持--Excel表格里的数据全部变成了时间或者日期格式的时候怎么办???

20150601 问题描述:Excel表格里的数据全部变成了时间或者日期格式的时候怎么办??? 解决办法: 1. 打开Excel,任意选中一单元格,单击鼠标右键,选择设置单元格格式. 2. 在数字自定义类型中,找到如图中前缀为[$-F400]的类型格式(或者类似的比如[$-F800]),点击删除.3. 保存,大功告成!再次打开,世界清静了.

[ller必读] LoveLive! 必备技能之 Python Pillow 自动处理截图

起因 喜欢的歌,静静地听:喜欢的人,远远的看.30天前,就是3月14号,我情不自禁地走近了<LoveLive!学院偶像祭>,这是我的第一张卡片(见下图).第二天也就是3月15日,海未生日了.   之后我一直搜集游戏过程中遇到的卡片(截屏),卡片本身有一定的比例,而我的手机屏幕分辨率是 1920x1080,截完的图像下面这样.整个游戏界面并没有充满屏幕,所以有黑边:卡片比游戏界面小,截出的图很不美观而且方向不正. 中间的卡片的区域是 1080x1520 我本人并不是处女座,然而也不能忍受不美好的

python读取excel表格的数据

1.在Windows命令行中安装第三方模块xlrd,先切到python安装目录(Python34),然后切到Scripts,然后输入命令easy_install xlrd按回车进行安装 安装完成 2.新建一个excel表,然后保存,造数据 3.编写python脚本 #utf-8 import xlrd     #导入第三方模块xlrd excel = xlrd.open_workbook('C:\\表格.xlsx')       #打开目标表格文件(填写路径) sheet = excel.she

Python读写excel表格的方法二

目的:实现用python的另一种方法做excel的读取.新增操作. 环境:ubuntu 16.04  Python 3.5.2 情景:之前介绍了一种操作excel文件的方法(私链),现在使用另一种方法读写excel文件,一次性读出或写入,读写也很方便,读出为有序字典,像二维数组,需要用到3个第三方模块,pyexcel-io, pyexcel-xls, xlrd,主要导入pyexcel-xls和collections,pyexcel-xls基于xlrd和pyexcel-io,所以支持xls和xls