擅长:python、mysql、java
<p>让我们在<code>extract()</code>上耍些小把戏</p>
<blockquote>
<p>PageElement.extract() removes a tag or string from the tree.</p>
</blockquote>
<p>示例:</p>
<pre><code><html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's <i>story</i></b></p>
....
</code></pre>
<p>如果您只需在目标标记上使用<code>extract()</code>,您将得到</p>
^{pr2}$
<p>但是如果提取标记上的<code>.next</code>元素,则得到</p>
<pre><code>>> soup.find('p', {"class": "title"}).next.extract()
<b>The Dormouse's <i>story</i></b>
</code></pre>