我得到了一个包含两列的数据集,一列带有分类值(State2
),另一列(State
),只包含二进制中相同的值。
我用了OneHotEncoding
import pandas as pd
mydataset = pd.read_csv('fieldprotobackup.binetflow')
mydataset.drop_duplicates(['Proto2','Proto'], keep='first')
mydataset.to_csv('fieldprotobackup.binetflow', columns=['Proto2','Proto'], index=False)
我想删除文件中所有多余的内容。在研究过程中,我发现了命令df.drop_duplicates
,但它对我不起作用
您要么需要添加
inplace=True
参数,要么需要捕获返回的数据帧:或者
当某些东西没有按预期工作时,检查documentation总是一个好主意
相关问题 更多 >
编程相关推荐