pandas筛选2个csv文件列内容相同的项

import pandas as pd

a= pd.read_csv(a_csv_file, usecols=[1])

b= pd.read_csv(b_csv_file, usecols=[1])

a_list = a.values.tolist()

b_list = b.values.tolist()

new_a_list = [f[0] for f in a_list]

new_b_list = [f[0] for f in b_list]

both = list(set(new_a_list ).intersection(set(new_b_list )))

原文地址:https://www.cnblogs.com/zhengbiqing/p/11741191.html

时间: 2024-07-30 01:42:01

pandas筛选2个csv文件列内容相同的项的相关文章

python用pandas工具包来处理.csv文件,包括读写和切片

csv是Comma-Separated Values的缩写,是用文本文件形式储存的表格数据.我们用python处理.csv文件时,发现用pandas工具包比csv工具包要方便很多,下面介绍一下一些基本的操作,如读写(read, write)和切片(slice). 写(write)操作: import pandas as pd # 每个列表表示csv文件里面的一列a = [1, 2, 3]b = [4, 5, 6]c = [7, 8, 9] # 字典中的key值就是csv中的列名csv_file

Pandas库08_存取CSV文件

#学会csv.txt文件的读取与存储,了解pandas函数的参数的使用#JSON与Excel数据,学会对JSON与Excel数据的读取与存储import numpy as npimport pandas as pd t_data={ "name":["唐浩","小王","老王","赵三","李四","王姐"], "sex":["男&quo

PHP读取csv文件的内容

一次性读取csv文件内所有行的数据 <?php  $file = fopen('windows_2011_s.csv','r');  while ($data = fgetcsv($file)) { //每次读取CSV里面的一行内容 //print_r($data); //此为一个数组,要获得每一个数据,访问数组下标即可 $goods_list[] = $data;  } //print_r($goods_list); /* foreach ($goods_list as $arr){     

pandas合并多个csv文件

import pandas as pd import os #文件路径注意用\\ inputfilepath = 'C:\\Users\\Administrator\\AAA\\BBB\\' outputfilepath = 'C:\\Users\\Administrator\\AAA\\' df_filename = 'file_8_27-11_19.csv' columns_list = ['id', 'Code', 'Name', 'update_time'] #先创建一个只有表头列名的空

使用pandas处理大型CSV文件

# -*- coding:utf-8 -*- ''' CSV 常用API 1)reader(csvfile[, dialect='excel'][, fmtparam]),主要用于CSV 文件的读取,返回一个 reader 对象用于在CSV 文件内容上进行行迭代. 参数: csvfile,需要是支持迭代(Iterator)的对象,通常对文件(file)对象或者列表(list)对象都是适用的,并且每次调用next() 方法的返回值是字符串(string): dialect 的默认值为excel,与

使用Python如何处理csv文件?

本文和大家分享的主要是使用python语言处理csv文件相关内容,一起来看看吧,希望对大家学习python开发有所帮助. CSV(Comma-Separated Values)即逗号分隔值,可以用Excel打开查看.由于是纯文本,任何编辑器也都可打开.与Excel文件不同,CSV文件中: · 值没有类型,所有值都是字符串 · 不能指定字体颜色等样式 · 不能指定单元格的宽高,不能合并单元格 · 没有多个工作表 · 不能嵌入图像图表 在CSV文件中,以 , 作为分隔符,分隔两个单元格.像这样 a,

Powershell 比较 CSV文件

前几天论坛里面看见有网友提供了一个方法,如何使用Excel用来比较AD账户的变化,使用的是Excel内置的比较功能. 豆子试了试Powershell的Compare-object方法 也可以做到同样的效果,而且从脚本的角度出发,用PS的效果肯定比手动去操作强很多. 简单的测试一下 创建两个csv文件,内容略有区别 使用Compare-object 比较一下,这里我用的是别名 diff, 同时指定我只想比较字段aa,结果如下所示 , =>表示 ccc只存在于右边( b.csv) 实验成功. 另外说

使用存储过程将Oracle数据批量导出为多个csv文件

数据库有如下表结构: user_info (   user_id           NUMBER primary key,   user_name     VARCHAR2(200) NOT NULL,         user_age        VARCHAR2(80),   create_date    DATE,   create_order   NUMBER ) 现在有100万条记录,要求每1000条记录导出为一个csv文件,内容用逗号分隔,共计1000个文件, 文件名称格式为ou

java基础 之 HashMap统计csv文件的单词

一:知识补充( 这个HashMap Map 和 c++的Map还是有很大的区别的,区别之大让人瞠目结舌,当然两者的作用是一致的,但是函数名称出入很大,就连iterator区别也很大的 ) (1)HashMap 和 HashTable的区别(c++中只有map木有hashmap的) HashMap不是线程安全的 hastmap是一个接口 是map接口的子接口,是将键映射到值的对象,其中键和值都是对象,并且不能包含重复键,但可以包含重复值.HashMap允许null key和null value,而