如何将多标签数据集拆分为多行,每行有一个标签?

2024-09-21 04:44:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫数据框,看起来像这样

Feature      Class
text1        [label1, label2]
text2        [label2, label3]

最好的方法是什么

Feature      Class
text1        label1
text1        label2
text2        label2
text2        label3

注意:在初始表中,类值是包含标签的Python列表


Tags: 数据方法列表标签featureclasslabel2label1
1条回答
网友
1楼 · 发布于 2024-09-21 04:44:00

您可以将^{}^{}一起使用,并通过^{}将列表展平:

from itertools import chain

df = pd.DataFrame({
    'Feature' : df['Feature'].values.repeat(df['Class'].str.len()),
    'Class' : list(chain.from_iterable(df['Class'].values.tolist()))
})
print (df)
  Feature   Class
0   text1  label1
1   text1  label2
2   text2  label2
3   text2  label3

相关问题 更多 >

    热门问题