我正在尝试编写自定义标记器:
print(re.sub(' ',"\n",(re.sub('\\{|\\}|\\[|\\]|\\\\|\\/|\\\"|\\\'|\\,|\\=|\\(|\\)|\\:|\\||\\-|\\*|\\!|\\;|\\<|\\>|\\,|\\?|//@'," ",str))))
输出:
America
Category
States
of
the
United
States
Category
Southern
United
States
Link
FA
mk
许多新行正在插入。我正在尝试编写一个优化的代码来删除所有带有正则表达式的空行,而不必进入每个细节。我真的很担心节目的表现。我有超过1000亿条线路。所以,我有点担心行刑的时间。有什么建议吗?你知道吗
我试图做出如下输出:
America
Category
States
of
the
United
States
Category
Southern
United
States
Link
FA
mk
re.sub('\n{2,}', '\n', str)
将删除空行
您可以使用
join()
和split()
方法:输出:
编辑:
要将每个单词放在不同的行中,请使用
"\n"
而不是" "
:相关问题 更多 >
编程相关推荐