2024-09-25 08:38:36 发布
网友
我清理了我的csv文件,其中包含50000行文本,并标记每行。但是,在每一行中,单词都被分成不同的列:
202MAY || DEFEATED || LORDS || PEERS || BACK || NEW || LEVESON
但我希望每一行都被串联起来,而不是被每个标记化的单词分开:
202MAY DEFEATED LORDS PEERS BACK NEW LEVESON
每行一列
每一行都有不同的字数,所以不同的列数,我如何才能解决这个问题?你知道吗
str = "202MAY || DEFEATED || LORDS || PEERS || BACK || NEW || LEVESON" print str.replace(' ||', '')
你想要这样的东西吗?你知道吗
some_text = "202MAY || DEFEATED || LORDS || PEERS || BACK || NEW || LEVESON".split("||") print("".join(some_text)) #expected output: #202MAY DEFEATED LORDS PEERS BACK NEW LEVESON
[gokul@python ~]$ cat sample.csv a,b,c dd,gg,f,t,y x,y [gokul@python ~]$ sed -i "s/,//g" sample.csv [gokul@python ~]$ cat sample.csv abc ddggfty xy [gokul@python ~]$
因此,与其将文件作为结构化内容读取, 只需将文件读取为纯文本文件,并用null替换逗号。你知道吗
你想要这样的东西吗?你知道吗
因此,与其将文件作为结构化内容读取, 只需将文件读取为纯文本文件,并用null替换逗号。你知道吗
相关问题 更多 >
编程相关推荐