从fi中删除冗余的问题

2024-09-29 17:23:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我得到了一个包含两列的数据集,一列带有分类值(State2),另一列(State),只包含二进制中相同的值。
我用了OneHotEncoding

import pandas as pd

mydataset = pd.read_csv('fieldprotobackup.binetflow')

mydataset.drop_duplicates(['Proto2','Proto'], keep='first')
mydataset.to_csv('fieldprotobackup.binetflow', columns=['Proto2','Proto'], index=False)

Dataset

我想删除文件中所有多余的内容。在研究过程中,我发现了命令df.drop_duplicates,但它对我不起作用


Tags: csv数据二进制分类dropprotopdduplicates
1条回答
网友
1楼 · 发布于 2024-09-29 17:23:20

您要么需要添加inplace=True参数,要么需要捕获返回的数据帧:

mydataset.drop_duplicates(['Proto2','Proto'], keep='first', inplace=True)

或者

no_duplicates = mydataset.drop_duplicates(['Proto2','Proto'], keep='first')

当某些东西没有按预期工作时,检查documentation总是一个好主意

相关问题 更多 >

    热门问题