到目前为止,我得到的是:
import re
import csv
outfile1 = open('test_output.csv', 'wt')
outfileWriter1 = csv.writer(outfile1, delimiter=',')
rawtext = open('rawtext.txt', 'r').read()
print(rawtext)
rawtext = rawtext.lower()
print(rawtext)
re.sub('[^A-Za-z0-9]+', '', rawtext)
print(rawtext)
首先,当我运行这个程序时,标点符号没有被删除,所以我想知道我的表达是否有问题?在
其次,我尝试生成一个.csv列表,列出所有单词是否有标点符号,例如一个文本文件,上面写着“你好!今天天气不错。”会输出:
^{pr2}$我知道我可以用.split()来拆分单词,但除此之外,我不知道该怎么做!任何帮助都将不胜感激。在
试用此版本:
你可以这样做:
相关问题 更多 >
编程相关推荐