【表格数据】-去重

栏目:云苍穹知识作者:金蝶来源:金蝶云社区发布:2024-09-23浏览:1

【表格数据】-去重

1 功能说明

删除DataFrame中重复的行。

2 基本使用说明

传入一个DataFrame数据给“df”参数,通过输出打印其返回值,可以看到参数默认情况下的去重效果。

3 参数配置说明

  • df”参数:进行去重处理DataFrame数据。 例如以传入【读取Excel】返回的DataFrame数据为例。

  • “subset”参数:设置去重的依据列。

1) 默认为'',选定所有列,即所有列都重复的行才会被去除。

2) 输入列名的字符串,指定该列为依据列: 例如传入'备注',只保留一行,去除了所有重复值对应的行。

3) 输入列名为元素组成的有序序列,去除该多个列重复的行: 又如['产品','品质'],去除这两列的值都重复的行。

  • “keep”参数:用以设置保留重复数据的方式。

1) 默认为"first",保留第一次出现的重复行,通过行所引可以得知保留的第一次出现的重复行。

2) "last"则保留最后出现的重复行。

3) "False"则不保留所有的重复行,去除所有重复行。

  • inplace”参数:inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。

1)  对传入的df做输出打印,默认为False的情况下,df的值不变。

2)  设置为True,改变原df的值。

  • “返回值”:返回去重后的DataFrame。

【表格数据】-去重

1 功能说明删除DataFrame中重复的行。2 基本使用说明传入一个DataFrame数据给“df”参数,通过输出打印其返回值,可以看到参数默认情况下...
点击下载文档
确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息