擅长:python、mysql、java
<p>我想应该是这样的:</p>
<pre><code>(?s)(<word(?:(?!<word).)*)<word[^>]*?annotated="head".*?(<word[^>](?:(?<!</word>).)*)
</code></pre>
<p>因此,组1将包含id=16的节点“word”,组2将包含id=18的节点“word”。在</p>
<p>然后可以使用regex分别解析这些节点,如下所示:</p>
^{pr2}$
<p>你将得到两组“pos”和“token”。在</p>
<p>当然,可以使用单个regex,但这将非常难看。在</p>