Pandas 依据特定列去除重复值

2024-04-09 16:50:56 阅读数 3028

目的：依据特定的几个列，对数值相同的行进行删除

功能：针对输入的DataFrame格式的数据，去除指定列下面的重复的行，返回一个DataFrame数据

参数解释： $DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore\_index=False)$

用法示例：

df = df.drop_duplicates(subset=['brand', 'style'], keep='last', 'ignore_index'=True)