基于delimi将dataframe列拆分为两列

2024-10-03 09:09:24 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在为分类预处理文本，并按如下方式导入数据集：

dataset = pd.read_csv('lyrics.csv', delimiter = '\t', quoting = 2)

dataset在终端上打印：

^{pr2}$

但是，当我使用spyder检查变量datasetcloser时，我发现我只有一列，而不是所需的两列。在

考虑到歌词本身有逗号和“，”分隔符不起作用

如何更正上面的数据帧以获得：

1）一列lyrics

2）一列classification

每行对应的数据？在

Tags： csv 数据文本终端 read 方式分类 dataset

1条回答

网友

1楼 · 发布于 2024-10-03 09:09:24

如果您的歌词本身不包含逗号（它们很可能包含），那么您可以将read_csv与{}一起使用。在

但是，如果这不是一个选项，您可以使用str.rsplit：

dataset.iloc[:, 0].str.rsplit(',', expand=True)

^{pr2}$