简介:本文将介绍Python数据科学库Pandas中的merge()函数,该函数用于将两个DataFrame进行合并。我们将通过实例和图表来解释其用法和参数,并提供实际应用中的建议。
pd.merge()函数是Pandas库中用于合并两个DataFrame的关键函数之一。它可以根据一个或多个键将两个DataFrame的行进行匹配,然后返回一个新的DataFrame,其中包含来自两个输入DataFrame的列。
一、基本用法
假设我们有两个DataFrame,df1和df2,我们想要根据共同的列名’key’进行合并:
import pandas as pddf1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value1': [1, 2, 3, 4]})df2 = pd.DataFrame({'key': ['B', 'C', 'D', 'E'], 'value2': [5, 6, 7, 8]})merged_df = pd.merge(df1, df2, on='key')print(merged_df)
这将输出一个新的DataFrame,其中包含来自df1和df2的列’key’和’value1’以及’value2’。合并后的DataFrame将根据’key’列进行排序。
二、参数解释
pip install pandas。pd.merge(df1, df2, on='key', suffixes=('_df1', '_df2'))将为来自df1和df2的同名列分别添加’_df1’和’_df2’后缀。pd.merge(df1, df2, on='key', indicator=True)将在合并后的DataFrame中添加一个名为’_merge’的指示器列,其中包含字符串值’left_only’、’right_only’或’both’,表示该行数据分别只来自左侧输入、只来自右侧输入或同时来自两侧输入。