擅长:python、mysql、java
<p>在<code>regex</code>中有更多的能量。使用<code>re</code>模块。在</p>
<blockquote>
<p>This would get the <code><p></code> tags. I also wanted to get the <code><h3></code> tags.</p>
</blockquote>
<pre><code>soup = BeautifulSoup(content.text, 'lxml', parse_only=SoupStrainer(re.compile(r"p|h3")))
</code></pre>
<p>@玛蒂恩
对于属性,可以使用<code>attrs</code>。在</p>
^{pr2}$
<p>但显然不能为每个HTML应用<code>class</code>。您可以使用<code>css</code>选择器来解决它。在</p>
<pre><code>soup = BeautifulSoup(content.text, 'lxml', parse_only=SoupStrainer(["h1", "h2", "h3", "p"])).select("h1.foo, h2, h3, p")
</code></pre>