<p>输入Html</p>
<pre><code><section id="article">
<p>Hey This is XXX</p>
</section>
</code></pre>
<p>我使用lxmlxpath提取数据</p>
<pre><code>xpath_paragraph = '//section[@id="article"]/p//text()'
items = mydoc.xpath(xpath_paragraph)
</code></pre>
<p>我得到的结果是:</p>
<pre><code>Hey This is XXX
</code></pre>
<p>预期结果:</p>
<pre><code><p>Hey This is XXX</p>
</code></pre>
<p>结果是可以理解的,我正在提取文本,我也尝试了node()。它也不起作用。我需要用标签提取数据。你知道吗</p>