我需要从数据帧中提取以下单词
car+ferrari
数据集是
Owner Sold
type
car+ferrari J.G £500000
car+ferrari R.R.T. £276,550
car+ferrari
motobike+ducati
motobike+ducati
...
我需要创建一个列表,列出类型中的单词,但要分别区分它们。所以在这种情况下,我只需要car
和ferrari
名单应该是
my_list=['car','ferrari']
没有重复的。 所以我应该做的是选择类型car+ferrari并提取所有单词,将它们添加到一个列表中,如上图所示,没有重复项(我有许多car+ferrari行,但由于我需要创建一个包含术语的列表,我只需要提取这些术语一次)
任何帮助都将不胜感激
编辑:类型列是索引
添加@AMC建议的一种内置解决方案,以拆分熊猫系列:
详情请参阅pandas.Series.str.split
将熊猫索引转换为系列:
在索引上应用函数:
或
或
相关问题 更多 >
编程相关推荐