从一列中拆分艺术家名称

2024-10-02 22:35:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在从billboard 100名单中提取数据,一直在研究如何拆分艺术家的名字。这是一个csv文件,但在导出之前,我将数据保存在一个数据框中。我想使用python/pandas进行拆分。我已经包括了下面专栏的图片。艺术家的名字都在同一列与分隔符(红色)我想分裂,但它是非常复杂的。最常见的分隔符是“&;”,“具有“,”X“,所以基本上我需要帮助分裂成不同的列所有这些名字

我想我可以使用嵌套for循环,这样我就可以在这些分隔符的组合上拆分。我的想法是根据“(symbol)”、“X”、“X”和“featured”的模式进行拆分,但不确定这是否可行。有没有更简单的方法来做到这一点而不丢失数据?感谢所有的帮助


Tags: 文件csv数据pandasfor图片symbol名字
1条回答
网友
1楼 · 发布于 2024-10-02 22:35:12

考虑一个示例数据帧df

df = pd.DataFrame({'singers': ['A & B', 'C Featuring D', 'E X F', 'G % H']})
df
    singers
0   A & B
1   C Featuring D
2   E X F
3   G % H

现在,由您决定要选择哪个分隔符来拆分名称。可能只是X或者只是Featuring或者&或者全部。使用str.split实现这一点,如图所示-

df.singers.str.split('&|X|Featuring|%', expand=True)
    0   1
0   A   B
1   C   D
2   E   F
3   G   H

您甚至可以在split方法中添加任何其他符号

相关问题 更多 >