基于delimi将dataframe列拆分为两列

2024-10-03 09:09:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在为分类预处理文本,并按如下方式导入数据集:

dataset = pd.read_csv('lyrics.csv', delimiter = '\t', quoting = 2)

dataset在终端上打印:

^{pr2}$

但是,当我使用spyder检查变量datasetcloser时,我发现我只有一列,而不是所需的两列。在

enter image description here

考虑到歌词本身有逗号和“,”分隔符不起作用

如何更正上面的数据帧以获得:

1)一列lyrics

2)一列classification

每行对应的数据?在


Tags: csv数据文本终端read方式分类dataset
1条回答
网友
1楼 · 发布于 2024-10-03 09:09:24

如果您的歌词本身不包含逗号(它们很可能包含),那么您可以将read_csv与{}一起使用。在

但是,如果这不是一个选项,您可以使用str.rsplit

dataset.iloc[:, 0].str.rsplit(',', expand=True)

^{pr2}$

相关问题 更多 >