擅长:python、mysql、java
<p>假设这个html:</p>
<pre><code><p>This is my text string and this next <a href='https//somelink.org/'>part</a> is only partially enclosed in a tags.</p>
</code></pre>
<p>我们可以选择硒:</p>
<pre><code>p = driver.find_element_by_xpath('//p[contains(.,"next part")]')
</code></pre>
<p>我们可以确定它是否部分地与regex在一个a标签中(尽管是小马托尼):</p>
<pre><code>html = p.get_attribute('innerHTML')
partly_in_a = 'next part' in re.sub(r'</?a.*?>', '', html) and 'next part' not in html
</code></pre>
<p>对于这一点,没有纯XPath1.0解决方案,一般来说,依赖xpath来实现这样的功能是错误的。你知道吗</p>