如何为表中列中的每个逗号分隔值创建新行

text category sfsd sgvv abc sfsd sgvv xyz zydf sefs sdfsd yyy dfsd dsrgd dggr xyz eter vxg wfe abc dfvf ertet abc dfvf ertet abc

3条回答

网友

1楼 · 编辑于 2024-09-29 23:19:13

将^{}（0.25+）与^{}一起使用：

df1 = (df.assign(category = df['category'].str.split(','))
         .explode('category')
         .reset_index(drop=True))

对于旧版本，首先^{}用于非分隔列，然后^{}并通过^{}重塑，最后^{}-首先用于删除第二级MultiIndex，然后用于将索引转换为列：

df1 = (df.set_index('text')['category']
         .str.split(',', expand=True)
         .stack()
         .reset_index(level=1, drop=True)
         .reset_index(name='category'))
print (df1)
              text category
0        sfsd sgvv      abc
1        sfsd sgvv      xyz
2  zydf sefs sdfsd      yyy
3  dfsd dsrgd dggr      xyz
4     eter vxg wfe      abc
5       dfvf ertet      abc
6       dfvf ertet      xyz

网友

2楼 · 编辑于 2024-09-29 23:19:13

链接到this question，请为您的数据帧尝试以下代码：

We can first split the column, expand it, stack it and then join it back to the original df like below:

df.drop('category', axis=1).join(
  df['category'].str.split(',', expand=True).stack().reset_index(level=1,drop=True).rename('category'))

网友

3楼 · 编辑于 2024-09-29 23:19:13

对于更旧的版本，请尝试使用set_index+stack+str.split+unstack+reset_index：

print(df.set_index('text')
      .stack()
      .str.split(', ', expand=True)
      .stack()
      .unstack(-2)
      .reset_index(-1, drop=True)
      .reset_index())

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何为表中列中的每个逗号分隔值创建新行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >