擅长:python、mysql、java
<p>由于这似乎是xml数据,所以最好使用xml解析器,因为用正则表达式解析xml非常非常困难。在</p>
<p>但是,既然你特别要求一个正则表达式。。。在</p>
<p>您的规范有点不精确,对于正则表达式,您需要非常精确地确定什么是匹配。例如,将rdfs:标签值总是有一个你想脱掉的?每行总是只有一个这样的数据块,还是每行有多个?还有,结果的顺序重要吗?在</p>
<p>这里有一个快速的方法,可以让你接近你想要的:</p>
<pre><code>import re
data=r'<wn20schema:NounSynset rdf:about="&dn;synset-56242" rdfs:label="{saddelmageri_1}">"'
matches=re.findall('synset-([0-9]+).*label="{(.*)_1}"', data)
print "matches:", matches
</code></pre>
<p>当我运行上述命令时,我得到以下输出,这是一个包含两个元组的列表,其中包含您想要的两个字符串(尽管顺序不同):</p>
^{pr2}$