如何组合每行中的分隔列?

2024-09-25 08:38:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我清理了我的csv文件,其中包含50000行文本,并标记每行。但是,在每一行中,单词都被分成不同的列:

202MAY || DEFEATED || LORDS || PEERS || BACK || NEW || LEVESON

但我希望每一行都被串联起来,而不是被每个标记化的单词分开:

202MAY DEFEATED LORDS PEERS BACK NEW LEVESON

每行一列

每一行都有不同的字数,所以不同的列数,我如何才能解决这个问题?你知道吗


Tags: 文件csv标记文本newback单词peers
3条回答
str = "202MAY || DEFEATED || LORDS || PEERS || BACK || NEW || LEVESON"

print str.replace(' ||', '')

你想要这样的东西吗?你知道吗

some_text = "202MAY || DEFEATED || LORDS || PEERS || BACK || NEW || LEVESON".split("||")

print("".join(some_text))
#expected output:
#202MAY  DEFEATED  LORDS  PEERS  BACK  NEW  LEVESON
[gokul@python ~]$ cat sample.csv
a,b,c
dd,gg,f,t,y
x,y
[gokul@python ~]$ sed -i "s/,//g" sample.csv
[gokul@python ~]$ cat sample.csv
abc
ddggfty
xy
[gokul@python ~]$

因此,与其将文件作为结构化内容读取, 只需将文件读取为纯文本文件,并用null替换逗号。你知道吗

相关问题 更多 >