【数据分析&数据挖掘】pandas数据合并

 1 import pandas as pd
 2
 3 # 加载数据
 4 data_1 = pd.read_excel("./concat合并数据.xlsx", sheetname=0)
 5 data_2 = pd.read_excel("./concat合并数据.xlsx", sheetname=1)
 6
 7 print("data_1: \n", data_1)
 8 print("data_2: \n", data_2)
 9
10 # 外连接——求并集
11 # 内链接——求交集
12 # 左(外)链接——以左表为主求并集
13 # 右(外)链接——以右表为主求并集
14
15 # 直接拼接方式——pd.concat()
16 # axis=0, 外连接——行上直接拼接,列上求并集
17 res = pd.concat((data_1, data_2), axis=0, join="outer")
18 # axis = 0, 内连接——行上直接拼接,列上求交集
19 # res = pd.concat((data_1, data_2), axis=0, join="inner")
20
21 # axis = 1, 外连接——列上直接拼接,行上求并集
22 # res = pd.concat((data_1, data_2), axis=1, join="outer")
23 # axis = 1, 内连接——列上直接拼接,行上求交集
24 # res = pd.concat((data_1, data_2), axis=1, join="inner")
25 print("res: \n", res)
26
27 # 主键拼接方式
28 # 加载数据
29 left = pd.read_excel("./主键拼接数据.xls", sheetname=0)
30 right = pd.read_excel("./主键拼接数据.xls", sheetname=1)
31 print("left: \n", left)
32 print("right: \n", right)
33
34 # 主键拼接
35 # 外连接——将所有的key进行拼接, 如果没有补NaN
36 res = pd.merge(left=left, right=right, on="key", how="outer")
37 # 内链接——将共同所有的key进行拼接
38 res = pd.merge(left=left, right=right, on="key", how="inner")
39 # 左外连接——将左表所有的key进行拼接,右表来配合坐标,如果右表没有key补NaN
40 res = pd.merge(left=left, right=right, on="key", how="left")
41 # 右外连接——将右表所有的key进行拼接,右表来配合坐标,如果右表没有key补NaN
42 res = pd.merge(left=left, right=right, on="key", how="right")
43 print("res: \n", res)
44
45 # 加载数据
46 left = pd.read_excel("./主键拼接数据_同值不同key.xls", sheetname=0)
47 right = pd.read_excel("./主键拼接数据_同值不同key.xls", sheetname=1)
48
49 print("left: \n", left)
50 print("right: \n", right)
51
52 # 将坐标中的key_left与右表中的key_right的所有值来进行左右拼接,如果只单独存在于一方,另一方补NaN
53 res = pd.merge(left=left, right=right, left_on="key_left", right_on="key_right", how="outer")
54 # 将坐标中的key_left与右表中的key_right共同拥有的key值进行左右拼接
55 res = pd.merge(left=left, right=right, left_on="key_left", right_on="key_right", how="inner")
56 # 将左表中的key_left中所有的key进行左右连接, 右表配合左表, 如果没有相同的Key_right值,补NaN
57 res = pd.merge(left=left, right=right, left_on="key_left", right_on="key_right", how="left")
58 # 将左表中的key_right中所有的key进行左右连接, 左表配合右表, 如果没有相同的Key_left值,补NaN
59 res = pd.merge(left=left, right=right, left_on="key_left", right_on="key_right", how="right")
60 print("res: \n", res)
61
62 # left.join()
63 # df1.join(df2)

原文地址:https://www.cnblogs.com/Tree0108/p/12116049.html

时间: 2024-11-06 07:13:34

【数据分析&数据挖掘】pandas数据合并的相关文章

【数据分析&数据挖掘】数据合并和拼接案例

1 import pandas as pd 2 import numpy as np 3 4 # 加载数据——detail 5 detail_1 = pd.read_excel("./meal_order_detail.xlsx", sheetname=0) 6 detail_2 = pd.read_excel("./meal_order_detail.xlsx", sheetname=1) 7 detail_3 = pd.read_excel("./me

【转】PANDAS 数据合并与重塑(concat篇)

转自:http://blog.csdn.net/stevenkwong/article/details/52528616 1 concat concat函数是在pandas底下的方法,可以将数据根据不同的轴作简单的融合 pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False) 参数说明 o

pandas数据大发888平台出租规整化:清理、转换、合并、重塑

数据分析和大发888平台出租haozbbs.comQ1446595067建模方面的大量编程工作都是用在数据准备上的:加载.清理.转换以及重塑.许多人选择使用通用编程语言或unix文本处理工具(如sed或awk)对数据格式进行专门处理. 幸运的是,pandas和python标准库提供了一组高级的.灵活的.高效的核心函数和算法,将数据规整化正确的形式. 合并数据集: pandas对象中的数据可以通过一些内置的方式进行合并:(1)pandas.merge可根据一个名多个键将不同DataFrame中的行

数据分析与展示——Pandas数据特征分析

Pandas数据特征分析 数据的排序 将一组数据通过摘要(有损地提取数据特征的过程)的方式,可以获得基本统计(含排序).分布/累计统计.数据特征(相关性.周期性等).数据挖掘(形成知识). .sort_index()方法在指定轴上根据索引进行排序,默认升序 .sort_index(axis=0, ascending=True) In [1]: import pandas as pd In [2]: import numpy as np In [3]: b = pd.DataFrame(np.ar

【数据分析&数据挖掘】numpy、pandas&matplotlib

1 import numpy as np 2 import pandas as pd 3 4 """ 5 numpy --科学计算库 6 核心---ndarray 7 本质: 存储单一数据类型的 内存连续的 N维数组 8 C F 风格存储 9 10 matplotlib ---数据可视化的库 11 能绘制2-D 与 3-D 图形 12 13 pandas ----进行数据处理的库 14 里面封装了部分numpy 与matplotlib 功能 15 结构核心: 16 常用两种结

pandas小记:pandas数据规整化

http://blog.csdn.net/pipisorry/article/details/39506169 数据分析和建模方面的大量编程工作都是用在数据准备上的:加载.清理.转换以及重 塑.有时候,存放在文件或数据库中的数据并不能满足数据处理应用的要求. pandas和Python标准库提供了一组高级的.灵活的.高效的核心函数和算法,它们能够轻松地将数据规整化为正确的形式. 数据正则化data normalization pandas.dataframe每行都减去行平均值 use DataF

[数据分析工具] Pandas 功能介绍(二)

条件过滤 我们需要看第一季度的数据是怎样的,就需要使用条件过滤 体感的舒适适湿度是40-70,我们试着过滤出体感舒适湿度的数据 最后整合上面两种条件,在一季度体感湿度比较舒适的数据 列排序 数据按照某列进行排序 “by”参数可以使用字符串,也可以是列表,ascending 的参数也可以是单个值或者列表 ascending 默认值是 True 列中的每行上的 apply 函数 在前一篇的增加列的部分,根据风速计算人体感觉是否舒适,为了功能的演示,在这里使用 DataFrame 的 apply 方法

Oracle 数据库实现数据合并:merge

1.使用update进行数据更新 1)最简单的更新 update tablea a set a.price=1.00 2)带条件的数据更新 update tablea a set a.price = 2.00  where  a.id='02' 3)两张表关联更新为固定值 update tablea a set a.price =3.00 where exits(select 1 from tableb b where a.id=b.id) 将a,b相同id的 a表的price 字段更新为 3.

【转】数据分析/数据挖掘 入门级选手建议

1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力.数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =. 2.怎么入门 请百度"如何成为一名数据分析师"或者"如何成为一名数据挖掘工程师".英文好上Quora,不行上知乎,看看入门资料. 3.选哪些书 看入门资料给你提供的书,有电子版下电子版,没电子版买纸质书,花不了多少钱. 4.用什么语言 数据分析:excel是必须,R是基本,pytho