我正在尝试编写一个函数,它可以执行以下操作:
>> foo("String. New sentence. And again.")
["String.", "New sentence.", "And again."]
我阅读了regex
上的文档并编写了以下代码:
def foo(string):
return re.split(r'([.!?])', string)
此函数输出保留标点符号,但将其与句子分开:
["String", ".", "New sentence", ".", "And again", "."]
我想把这三个句子分开
如何改进此功能
在结束分隔符之前包含字符,然后尝试
re.findall
:[^ ]
意味着我们要寻找的东西不是以空格开头的。.*?
表示任何字符,不包括其后的[.!?]
像这样的
将返回一个“句子”数组。修改regex以适应可能看到的字符类型
例如
相关问题 更多 >
编程相关推荐