【表格数据】-合并

栏目:云苍穹知识作者:金蝶来源:金蝶云社区发布:2024-09-23浏览:1

【表格数据】-合并

1 功能说明

将两个DataFrame数据集依照指定列,进行合并操作,得到一个新的DataFrame。

2 基本使用说明

1  "left":参与合并的左侧DataFrame数据集, "right":参与合并的右侧DataFrame数据集。 例如传入【读取excel】返回的DataFrame。

2 在“on”参数内指定用于连接合并两个DataFrame的列。

3 得到以“key”为指定列合并的DataFrame: df1。

df2如下。

3 参数配置说明

  • “left”参数:参与合并的左侧DataFrame数据集

  • “right”参数:参与合并的右侧DataFrame数据集

  • “on”参数:指定用于连接合并两个DataFrame的列,必须在左右DataFrame数据集中都存在(找到)的列。

1)未指定情况即默认为None,则以两个DataFrame中都存在的列名作为连接列。例如此处以“一”、“二”以及“三”这三列合并两个DataFrame。

2) 输入列名,以该列合并两个DataFrame。

3)输入列名为元素的有序集合,通过这些列合并两个DataFrame,例如输入列表['二','三']

  • "how"参数:用以设置合并两个DataFrame的方式,有'inner'(默认)、'outer''left'以及'right'四种方式。

1)'inner'(默认):内连接,使用指定列的交集合并两个DataFrame数据集,即根据列名,匹配出相同列内容的数据: 例如以“一”列作为合并列,两个DataFrame数据集中该列的交集只有一个。

2) 'outer':外连接,使用指定列的并集合并两个DataFrame数据集,即根据列名匹配出所有列内容的数据,未匹配上的内容填为NaN: 例如以“一”列作为合并列,匹配出两个DataFrame数据集中该列的所有内容数据。

3)'left':左连接,使用左侧DataFrame数据集指定列,即根据列名左侧DataFrame取全部,右侧DataFrame取匹配的内容,未匹配上的内容填为NaN: 例如以“一”列作为合并列,取左侧df1的全部,右侧df2只取与df1完全匹配的数据,其余内容填为NaN。

4)'right':右连接,使用右侧DataFrame数据集指定列,即根据列名右侧DataFrame取全部,左侧DataFrame取匹配的内容,未匹配上的内容填为NaN: 例如以“一”列作为合并列,取右侧df2的全部,左侧df1只取与df1完全匹配的数据,其余内容填为NaN。

  • "left_on"、 "right_on"参数:当两个DataFrame数据集合并的指定列不相同时,使用左侧DataFrame中的"left_on"列和右侧DataFrame中的"right_on"列作为合并列: 例如df1的“四”列和df2的“五”列作为指定列的外连接。

  • "left_index"和"right_index"参数:根据左右侧DataFrame中共有的index进行合并,默认为False,使用时需为True 。

  • “sort”参数 :按照字典顺序通过连接列对结果DataFrame进行排序;默认为True,设置为False时,在很多情况下大大提高性能。

  • “suffixes”参数 :对两个数据集中出现的重复列,新数据集中加上后缀进行区别,默认为('_x', '_y')。

【表格数据】-合并

1 功能说明将两个DataFrame数据集依照指定列,进行合并操作,得到一个新的DataFrame。2 基本使用说明1 "left":参与合并的左侧DataFram...
点击下载文档
确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息