擅长:python、mysql、java
<p>此正则表达式查找字母数字组,后跟任意数量的其他字符,然后再单独查找。然后,它在删除重复项的情况下遍历此列表,并给出这些字符组及其出现的次数:</p>
<pre><code>import re
s = "eg,abcgdfabc"
for word in set(re.findall(r'(\w+)(\w*?\1)+', s)):
print word, s.count(word)
</code></pre>
<p>印刷品</p>
^{pr2}$
<p>但是,如果我们不知道单词的确切含义,那么它只会在下面的字符串中找到一个重复的单词,尽管还有另一个候选词:</p>
<pre><code>abcdeabcecd
abc abc <- this will be found
cd cd <- this won't be found
</code></pre>