下面是我要搜索的文本文件类型的示例(名为usefile):
码头拟声词
停靠废话
废话码头废话
停靠
废话连篇
拟声词
废话连篇
废话坞
停靠废话
停靠废话
拟声词
我使用finditer语句查找DOCK和拟声词之间的所有内容,如下所示:
re.finditer(r'((dock)(.+?)(onomatopoeia))', usefile, re.I|re.DOTALL)
显然Dock是一个比拟声词更常见的词,我只想在Dock的第一个实例之间抓取拟声词之前的文本。我在上面使用的regex在Dock的第一个实例之间抓取文本,当它遇到拟声时停止,所以当我真正想要Dock拟声时,我可能会得到Dock Dock Dock拟声词。在
我想说清楚的是:
1码头拟声词
2DOCK-blah-blah拟声词
三。杜克布拉拟声词
有没有一种方法可以搜索拟声词并上到被告席的第一审,或者有更好的方法来解决我的问题?在
谢谢!在
这是一种算法方法:
一个消极的前瞻性断言就可以做到这一点。在
相关问题 更多 >
编程相关推荐