pandas 读取excel的指定列

不管对于read_csv还是read_excel,现在都有:

usecols : int or list, default None

  • If None then parse all columns,
  • If int then indicates last column to be parsed
  • If list of ints then indicates list of column numbers to be parsed
  • If string then indicates comma separated list of Excel column letters and column ranges (e.g. “A:E” or “A,C,E:F”). Ranges are inclusive of both sides.

而之前版本的:

parse_cols : int or list, default None

Deprecated since version 0.21.0: Pass in usecols instead.

可以看到在0.21.0版本后就已经完全被上面的那个给替代了。

这也算解决了我一个头疼的问题,总是把两个read的内容记混了。

所以对于最新版的pandas,只需要:

df = pd.read_excel("data.xlsx", usecols=[0, 5]) # 指定读取第1列和第6列
# 当然也可以用"A,F"代替[0,5]

原文地址:https://www.cnblogs.com/cymwill/p/8523877.html

时间: 2024-10-19 20:45:49

pandas 读取excel的指定列的相关文章

机器学习之数据预处理,Pandas读取excel数据

Python读写excel的工具库很多,比如最耳熟能详的xlrd.xlwt,xlutils,openpyxl等.其中xlrd和xlwt库通常配合使用,一个用于读,一个用于写excel.xlutils结合xlrd可以达到修改excel文件目的.openpyxl可以对excel文件同时进行读写操作. 而说到数据预处理,pandas就体现除了它的强大之处,并且它还支持可读写多种文档格式,其中就包括对excel的读写.本文重点就是介绍pandas对excel数据集的预处理. 机器学习常用的模型对数据输入

thinkphp用phpexcel读取excel,并修改列中的值,再导出excel,带往excel里写入图片

<?php class GetpriceAction extends AdministratorAction { // 文件保存路径 protected $savepath; // 允许上传的文件类型 protected $allowFileType; public function _initialize(){ parent::_initialize(); $this->savepath = './xxx/'.date('Ymd').'/'; $this->allowFileType

用pandas读取excel报错

用pandas.read_execl()方法读取excel文件报错. 后来导入xlrd第三方库,就好了. 原文地址:https://www.cnblogs.com/tianqianlan/p/10296787.html

pandas读取Excel

time31 = pd.read_excel('F:/save_file/3问出车表.xlsx', sheetname='Sheet1') # 读取'3问出车表.xlsx'中的Sheet1表单, time32 = pd.read_excel('F:/save_file/3问出车表.xlsx', sheetname='Adjustment') # 读取'3问出车表.xlsx'中的Adjustment表单 time31 = time31.replace('NaN',0) time32 = time3

Excel表格指定列数据转换成文本

问题:表格的某一列数据以多种格式存储(有的为文本,有的为数字:如下图),但是需求是所有的都以文本形式存储: 在此特定情况下,需要将一列数据全部转换为文本(左上角带绿色小图标的为以文本形式存储的数字): 解决方案:数据-分列-下一步-下一步-选择文本-完成: PS:在不同情境下,往往面临多种解决方案,原则依然是择优而取.

python利用pandas和xlrd读取excel,特征筛选删除0值超过99%的列

利用xlrd读取excel筛选0值超过99%的列,并删除import xlrdworkbook=xlrd.open_workbook(r"123.xlsx")table = workbook.sheet_by_name('Sheet1')nrows=table.nrowsncols=table.ncolsdel_col=[]for j in range(ncols) : sum = 0 for ai in table.col_values(j): if ai == 0.0 : sum+

Pandas 读取超过 65536 行的 Excel 文件

Excel 文件的格式曾经发生过一次变化,在 Excel 2007 以前,使用扩展名为 .xls 格式的文件,这种文件格式是一种特定的二进制格式,最多支持 65,536 行,256 列表格.从 Excel 2007 版开始,默认采用了基于 XML 的新的文件格式 .xlsx ,支持的表格行数达到了 1,048,576,列数达到了 16,384.需要注意的是,将 .xlsx 格式的文件转换为 .xls 格式的文件时,65536 行和 256 列之后的数据都会被丢弃. Pandas 读取 Excel

人生苦短_我用Python_openpyxl库读取Excel文件数据_008

上图为读取的目标文件--------------------------------------------------------------------------------- # coding=utf-8 ''': 第一步:最简单的读取文件Demo,读取文件中的某个值,和写入某个单元格的值 Excel wordbook 工作簿 ->>确定sheet表单 --->cell 单元格 pip install openpyxl ''' # 终极目标 读取successed # from

读取文本文件中指定的几列

今天在论坛上看到一个问题,这个问题大概是这样的,读取文本文件中指定的几列,并存储入数据库中. Insus.NET花上些少时间,实现读取文本的功能部分.创建一个文本文件,文本添加好几行.每一行有好几列,列与列之间使用逗号分隔. adf,adfadf,adsfgads,qwer,wrt,wrey,asdfs,qwer,tryerqert6uy7,468u4,578,qewrqew,qwertwet,67u46,45676,45qer87,47857,et356y,etyedgh adsadf,adf