我有2个数据帧。我需要他们有相同的标签编码,因为我想使用他们的机器学习
dftrain.label.unique()
array(['normal.', 'buffer_overflow.', 'loadmodule.', 'perl.', 'neptune.',
'smurf.', 'guess_passwd.', 'pod.', 'teardrop.', 'portsweep.',
'ipsweep.', 'land.', 'ftp_write.', 'back.', 'imap.', 'satan.',
'phf.', 'nmap.', 'multihop.', 'warezmaster.', 'warezclient.',
'spy.', 'rootkit.'], dtype=object)
dftest.label.unique()
array(['normal.', 'snmpgetattack.', 'named.', 'xlock.', 'smurf.',
'ipsweep.', 'multihop.', 'xsnoop.', 'sendmail.', 'guess_passwd.',
'saint.', 'buffer_overflow.', 'portsweep.', 'pod.', 'apache2.',
'phf.', 'udpstorm.', 'warezmaster.', 'perl.', 'satan.', 'xterm.',
'mscan.', 'processtable.', 'ps.', 'nmap.', 'rootkit.', 'neptune.',
'loadmodule.', 'imap.', 'back.', 'httptunnel.', 'worm.',
'mailbomb.', 'ftp_write.', 'teardrop.', 'land.', 'sqlattack.',
'snmpguess.'], dtype=object)
正如您所看到的,测试集中有一些标签在列车集中不存在
目前没有回答
相关问题 更多 >
编程相关推荐