我想从包含特定字符(/IN)的字符串中提取单词,直到提取到其他特定字符(/NNP)。我的代码到目前为止(仍然不起作用):
import re
sentence = "Entah/RB kenapa/NN ini/DT bayik/NN suka/VBI banget/JJ :/: )/CP :/: )/CP :/: )/CP berenang/VBI di/IN Jln/NN Terusan/NNP Borobudur/NNP dan/NN di/IN Jalan/NN Perempatan/ADJ Malioboro/NNP"
tes = re.findall(r'((?:\S+/IN\s\w+/NNP\s*)+)', sentence)
print(tes)
所以sentence
包含我想提取的单词di/IN Jln/NN Terusan/NNP Borobudur/NNP
和{
这样做最好的方法是什么?谢谢。在
使用
参见regex demo
详细信息
\S+
-1+个非空白符号/IN\b
-a/IN
子串作为一个整词(?:(?!\S+/IN\b).)+
-除换行符以外的任何1+字符,它们与\S+/IN\b
模式序列不匹配(也可以使用re.DOTALL
来匹配换行符)\S+/NNP\b
-1+非空白,/NNP
作为整个单词(因为\b
是一个单词边界)相关问题 更多 >
编程相关推荐