如何用多个字符串对数据帧列进行热编码?

2024-09-27 04:20:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在建立一个回归模型来预测食物的运送时间

这是一个有一些观察的数据帧

1

如果你观察美食专栏,你会发现它有很多弦。使用代码

pd.get_dummies(data.Cuisines.str.split(',',expand=True),prefix='c')

这有助于我分割字符串和热编码,然而,有一个新问题需要处理

合并了数据帧和假人。快餐出现在第一排和第三排。预期的输出是第一行和第三行的值为1的单个快餐列,但是,创建了两个快餐列。第一行创建快餐(第4列),第三行创建快餐(第15列)

2

有人能帮我解决这个问题吗?帮我在第一行和第三行得到一个值为1的快餐栏,其他菜系也是如此


Tags: 数据代码模型dataget时间pdsplit

热门问题