我正在从billboard 100名单中提取数据,一直在研究如何拆分艺术家的名字。这是一个csv文件,但在导出之前,我将数据保存在一个数据框中。我想使用python/pandas进行拆分。我已经包括了下面专栏的图片。艺术家的名字都在同一列与分隔符(红色)我想分裂,但它是非常复杂的。最常见的分隔符是“&;”,“具有“,”X“,所以基本上我需要帮助分裂成不同的列所有这些名字
我想我可以使用嵌套for循环,这样我就可以在这些分隔符的组合上拆分。我的想法是根据“(symbol)”、“X”、“X”和“featured”的模式进行拆分,但不确定这是否可行。有没有更简单的方法来做到这一点而不丢失数据?感谢所有的帮助
考虑一个示例数据帧
df
现在,由您决定要选择哪个分隔符来拆分名称。可能只是
X
或者只是Featuring
或者&
或者全部。使用str.split
实现这一点,如图所示-您甚至可以在split方法中添加任何其他符号
相关问题 更多 >
编程相关推荐