数据的合并和拼接

article/2025/10/6 0:58:27

文章目录

  • Merge方法
    • 1.1 内连接(交集)
    • 1.2 外连接(并集)
    • 1.3 左连接
    • 1.4 右连接
    • 1.5 基于多列的连接算法
    • 1.6 基于index的连接方法
  • 2. join方法
  • 3. concat方法
    • 3.1 series类型的拼接方法
    • 3.2 dataframe类型的拼接方法

  • merge方法主要是基于两个dataframe的共同列进行合并
  • join方法主要是基于两个dataframe的索引进行合并
  • concat方法是对series或dataframe进行行拼接或列拼接

Merge方法

将两个dataframe连接起来

参数含义
left/right左/右位置的dataframe。
how数据合并的方式——内连接,外连接,左连接,右连接
left基于左dataframe列的数据合并;
right基于右dataframe列的数据合并;
outer基于列的数据外合并(取并集);
inner基于列的数据内合并(取交集);默认为’inner’。
on用来合并的列名,这个参数需要保证两个dataframe有相同的列名。
left_on/right_on左/右dataframe合并的列名,也可为索引,数组和列表。
left_index/right_index是否以index作为数据合并的列名,True表示是。
sort根据dataframe合并的keys排序,默认True。
suffixes若有相同列且该列没有作为合并的列,可通过suffixes设置该列的后缀名,一般为元组和列表类型。

1.1 内连接(交集)

# 单列的内连接
# 定义df1
df1 = pd.DataFrame({'alpha':['A','B','B','C','D','E'],'feature1':[1,1,2,3,3,1],
'feature2':['low','medium','medium','high','low','high']})
# 定义df2
df2 = pd.DataFrame({'alpha':['A','A','B','F'],'pazham':['apple','orange','pine','pear'],
'kilo':['high','low','high','medium'],'price':np.array([5,6,5,7])})

在这里插入图片描述在这里插入图片描述

df3 = pd.merge(df1,df2,how='inner',on='alpha')
df3

在这里插入图片描述

1.2 外连接(并集)

在这里插入图片描述在这里插入图片描述

df4 = pd.merge(df1,df2,how='outer',on='alpha')
df4

在这里插入图片描述

1.3 左连接

在这里插入图片描述在这里插入图片描述

df5 = pd.merge(df1,df2,how='left',on='alpha')
df5

在这里插入图片描述

1.4 右连接

在这里插入图片描述在这里插入图片描述

df6 = pd.merge(df1,df2,how='right',on='alpha')
df6

在这里插入图片描述

1.5 基于多列的连接算法

多列的内连接:

df1 = pd.DataFrame({'alpha':['A','B','B','C','D','E'],'beta':['a','a','b','c','c','e'],
'feature1':[1,1,2,3,3,1],'feature2':['low','medium','medium','high','low','high']})df2 = pd.DataFrame({'alpha':['A','A','B','F'],'beta':['d','d','b','f'],'pazham':['apple','orange','pine','pear'],
'kilo':['high','low','high','medium'],'price':np.array([5,6,5,7])})

在这里插入图片描述在这里插入图片描述

df7 = pd.merge(df1,df2,on=['alpha','beta'],how='inner')
df7

在这里插入图片描述
.
多列的右连接:

df8 = pd.merge(df1,df2,on=['alpha','beta'],how='right')
df8

在这里插入图片描述

1.6 基于index的连接方法

2. join方法

join和merge的连接方法类似

3. concat方法

concat方法是拼接函数,有行拼接和列拼接,默认是行拼接,拼接方法默认是外拼接(并集),拼接的对象是pandas数据类型。

3.1 series类型的拼接方法

行拼接:
在这里插入图片描述
行拼接若有相同的索引,为了区分索引,我们在最外层定义了索引的分组情况。
在这里插入图片描述
列拼接:
默认以并集的方式拼接
在这里插入图片描述

以交集的方式拼接:
在这里插入图片描述
设置列拼接的列名:
在这里插入图片描述
对指定的索引拼接:

3.2 dataframe类型的拼接方法

行拼接:

df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3', 'K4', 'K5'], 'A': ['A0', 'A1', 'A2', 'A3', 'A4','A5']})
df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2'],'B': ['B0', 'B1', 'B2']})
# 行拼接
pd.concat([df1,df2])

在这里插入图片描述
列拼接:

pd.concat([df1,df2],axis=1)

在这里插入图片描述


http://chatgpt.dhexx.cn/article/j00Kx62S.shtml

相关文章

STATA数据合并与追加(一)Merge

文章目录 Why Merge?一、Description 简要描述二、Syntax 命令语法1.语法示例2.Options 参数选项Merge命令的options 参数表参数具体说明 3.Remarks and examples 具例说明3.1 Overview 概述部分(1)Merge 1:1 varlist......指定一对一匹配合并(2)Merge 1:m 和 Merge…

5.1 合并数据

5.1 合并数据 5.1.1 堆叠合并数据1、横向堆叠 concat()2、纵向堆叠 concat()和append() 5.1.2 主键合并数据 merge()和join()5.1.3 重叠合并数据 combine_first() 5.1.1 堆叠合并数据 堆叠就是简单地把两个表拼在一起,也被称作轴向连接、绑定或连接。依照连接轴的方…

极速系列03—python进行数据合并(concat/merge)

两个表中的数据,要根据关键字段,进行合并。 在Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。 1、pd.concat pd.concat 函数 拼接的对象可以是series,还可以是dataframe拼接对象的个数不受限axis …

Pandas 合并数据集

在数据挖掘过程中,经常会有不同表格的数据需要进行合并操作。今天介绍通过python下的pandas库下的merge方法和concat方法来实现数据集的合并。 1.merge merge 函数通过一个或多个键来将数据集的行连接起来。该函数的主要 应用场景是针对同一个主键存在两张包含不同…

「python」DataFrame数据合并

使用python读取数据,进行所谓表的合并是非常常见的。但是我在这里不是介绍如何合并不同类型的表格 介绍两个函数:pandas.merge和pandas.concat 1. merge merge可以翻译成是融合的意思,使用的时候注意参数的设置。 函数的参数: …

Pandas | 详解数据的合并和拼接

转自Pandas | 详解数据的合并和拼接 个人学习收藏,侵删 -------------------------------------------------------------------------------------------------------- Pandas包的merge、join、concat方法可以完成数据的合并和拼接,merge方法主要基于…

一文搞定pandas的数据合并

作者:来源于读者投稿 出品:Python数据之道 一文搞定pandas的数据合并 在实际处理数据业务需求中,我们经常会遇到这样的需求:将多个表连接起来再进行数据的处理和分析,类似SQL中的连接查询功能。 pandas中也提供了几种方…

MySQL将多条数据合并成一条

数据库中存的是多条数据,展示的时候需要合并成一条 数据表存储形式如下图 以type分组,type相同的算一条,且保留image和link的所有数据,用groupBy只保留一条数据 解决方案:用 GROUP_CONCAT 完整语法如下 group_conc…

python数据合并

1.横向堆叠,即将两个表在x轴上拼接到一起,可以用concat函数进行。concat函数的基本语法如下: pandas.concat(objs,axis0,joinouter,join_axesNone,ignore_indexFalse, keysNone,levelsNone,namesNone,verify_integrityFalse,copyTrue) objs&…

python DataFrame数据合并 merge()、concat()方法

文章目录 merge()1.常规合并①方法1②方法2重要参数合并方式 left right outer inner准备数据‘inner(默认)outerleftright 2.多对一合并3.多对多合并 concat()1.相同字段的表首位相连2.横向表合并(行对齐)3.交叉合并 merge() 1.常…

python数据分析之pandas数据合并

🌷这一章节来介绍pandas中的DateFrame实现数据合并的操作,类似于SQL中的内连接、外连接的操作. 目录 1. 合并数据的方式2. Merge合并方法2.1 连接2.1.1 直接用on连接2.1.2 采用left_on 和 right_on连接2.1.3 采用left_index 和 right_index连接 2.2 合并…

Pandas数据合并与拼接的5种方法

pandas实现数据的合并与拼接 目录 一、DataFrame.concat:沿着一条轴,将多个对象堆叠到一起 二、DataFrame.merge:类似 vlookup 三、DataFrame.join:主要用于索引上的合并 四、Series.append:纵向追加Series 五、…

Pandas 数据处理 | 多个数据表怎么合并(merge),你了解么?

Pands 两个数据列表合并方法总结; merge() 函数用于合并两个 DataFrame 对象或 Series,数据处理时经常会用到这个函数,官网给出该函数的定义如下: pandas.merge(left, right, how: str ‘inner’, onNone, left_onNone, right_…

[Pandas] 数据合并 pd.merge

实现类似SQL的join操作,通过pd.merge()方法可以自由灵活地操作各种逻辑的数据连接、合并等操作 可以将两个DataFrame或Series合并,最终返回一个合并后的DataFrame 语法 pd.merge(left, right, how inner, on None, left_on None, right_on None,l…

6.1 多数据源合并

1.案例介绍 通过Kettle工具将A公司和B公司的手机日销售数据合并到一个数据源(数据表company)中,也就是对文件company_a.csv和数据表company_b中的数据进行合并操作,并输出到数据表company中。 2.数据准备 假设,某公…

数据合并之concat、append、merge和join

Pandas 是一套用于 Python 的快速、高效的数据分析工具。它可以用于数据挖掘和数据分析,同时也提供数据清洗功能。本文将详细讲解数据合并与连接,目录如下: ① concat 一.定义 concat函数可以在两个维度上对数据进行拼接,默认纵向…

这些数据合并的神操作,你掌握几个?

导读:在数据分析过程中,有时候需要将不同的数据文件进行合并处理。本文主要介绍三种数据合并方法。 Pandas提供了多功能、高性能的内存连接操作,本质上类似于SQL等关系数据库,比如,merge、join、concat等方法可以方便地…

6、数据的合并

目录 一、添加变量即横向合并。 二、添加个案即纵向合并 在实际工作中,为了提高效率,经常需要将一份数据分成几部分分别录入,或为了便于分析,又将几个数据文件合并成一个总的数据文件。为此,SPSS提供了两种合并数据文…

【数据科学】05 数据合并(merge、concat、combine)与数据清洗(缺失值、重复值、内容和格式)

文章目录 1. 数据合并1.1 merge()合并1.2 concat()合并1.3 combine()合并 2. 数据清洗2.1 缺失值2.2 重复值2.3 内容与格式清洗 1. 数据合并 实际应用中,需要分析的数据可能来自不同的数据集,因此在开始数据分析之前,需要先将不同的数据集合…

Gradle 入门

1、Gradle 入门 1.1 Gradle 简介 Gradle 是一款 Google 推出的基于JVM、通用灵活的项目构建工具,支持 Maven,JCenter 多种第三方仓库;支持传递性 依赖管理、废弃了繁杂的 xml 文件,转而使用简洁的、支持多种语言(例如:java、gro…