我有一个表,其中一列是二进制特性的数组,当该特性存在时,它们就在那里。你知道吗
我想在这些行上训练一个逻辑模型,但是无法获得所需格式的数据,其中每个特征值都是它自己的一列,值为1或0。你知道吗
示例:
id feature values
1 ['HasPaws', 'DoesBark', 'CanFetch']
2 ['HasPaws', 'CanClimb', 'DoesMeow']
我想把它改成
id HasPaws DoesBark CanFetch CanClimb DoesMeow
1 1 1 1 0 0
2 1 0 0 1 0
似乎会有一些内置的功能来实现这一点,但我想不出这个转换是什么来做一个更好的搜索我自己。你知道吗
方法1
方法2
方法3
另一种方法是循环遍历
feature values
列,并从每个单元格构造一个序列,将列表中的值作为索引。通过这种方式,pandas将把序列扩展成一个以index
作为头的数据帧:您可以先将列表转换为列,然后使用get_dummies()方法:
相关问题 更多 >
编程相关推荐