从fi中删除冗余的问题

2024-09-29 17:23:20 发布

男 | 程序猿一只，喜欢编程写python代码。

我得到了一个包含两列的数据集，一列带有分类值（State2），另一列（State），只包含二进制中相同的值。
我用了OneHotEncoding

import pandas as pd

mydataset = pd.read_csv('fieldprotobackup.binetflow')

mydataset.drop_duplicates(['Proto2','Proto'], keep='first')
mydataset.to_csv('fieldprotobackup.binetflow', columns=['Proto2','Proto'], index=False)

Dataset

我想删除文件中所有多余的内容。在研究过程中，我发现了命令df.drop_duplicates，但它对我不起作用

Tags： csv 数据二进制分类 drop proto pd duplicates

1条回答

网友

1楼 · 发布于 2024-09-29 17:23:20

您要么需要添加inplace=True参数，要么需要捕获返回的数据帧：

mydataset.drop_duplicates(['Proto2','Proto'], keep='first', inplace=True)

或者

no_duplicates = mydataset.drop_duplicates(['Proto2','Proto'], keep='first')

当某些东西没有按预期工作时，检查documentation总是一个好主意

从fi中删除冗余的问题

相关问题更多 >

编程相关推荐

热门问题

热门文章

从fi中删除冗余的问题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >