关于OneHotEncoding Python的问题

import pandas as pd from sklearn.preprocessing import LabelEncoder,OneHotEncoder mydataset = pd.read_csv('originalfiletest.binetflow') le = LabelEncoder() dfle = mydataset dfle.State = le.fit_transform(dfle.State) X = dfle[['State']].values ohe = OneHotEncoder() Onehot = ohe.fit_transform(X).toarray() dfle['State'] = Onehot mydataset.to_csv('newfiletest.binetflow', columns=['Dur','State','TotBytes','average_packet_size','average_bits_psecond'], index=False)

1条回答

网友
1楼 · 发布于 2024-09-24 02:16:31

Onehot是numpy数组，问题在于将数组分配给dataframe列
import pandas as pd from sklearn.preprocessing import LabelEncoder, OneHotEncoder mydataset = pd.DataFrame(data={'State': ['a', 'a', 'b', 'c', 'a', 'd']}) le = LabelEncoder() mydataset.State = le.fit_transform(mydataset.State) X = mydataset[['State']].values ohe = OneHotEncoder() Onehot = ohe.fit_transform(X).toarray() dx = pd.DataFrame(data=Onehot) mydataset['State'] = (dx[dx.columns[0:]].apply(lambda x: ','.join(x.dropna().astype(int).astype(str)), axis=1)) mydataset.to_csv('newfiletest.binetflow', columns=['Dur', 'State', 'TotBytes', 'average_packet_size', 'average_bits_psecond'], index=False)

相关问题更多 >

编程相关推荐

热门问题

热门文章