不删除重复项的脚本

2024-10-05 11:01:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我是熊猫的新手,正在尝试删除一些不必要的列,然后删除重复记录。脚本的第一部分在删除列时起作用。但是,脚本没有执行任务的第二部分,因为还有大量重复项。任何帮助都将不胜感激

import pandas as pd
f =pd.read_csv("filename.csv")
    keep_col =['ZIP5','STATE CODE','STATE','COUNTY CODE','COUNTY NAME','CBSA CODE','CBSA TITLE','CBSA LSAD','METRO DIVISION CODE','METRO DIVISION TITLE','METRO DIVISION LSAD','CSA CODE','CSA TITLE','CSA LSAD']
    new_f = f[keep_col]
    new_f.drop_duplicates()
    new_f.to_csv("newfile.csv", index=False)

Tags: csv脚本newtitlecodecoldivisionpd
1条回答
网友
1楼 · 发布于 2024-10-05 11:01:41

您需要分配回或传递inplace=True

new_f = new_f.drop_duplicates()

new_f.drop_duplicates(inplace=True)

docs说明了这一点,通常几乎所有操作都返回一个副本,大多数操作都支持inplace参数,因此您需要在支持的地方将inplace=true赋值回覆盖或传递

相关问题 更多 >

    热门问题