擅长:python、mysql、java
<p>首先,您应该阅读.find\u all()和其他方法的作用:<a href="https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.html?highlight=find_all#find-all" rel="nofollow noreferrer">.find_all()</a></p>
<p>.find_all()的第一个参数是标记名。对我来说还可以</p>
<p/><div class="snippet" data-lang="js" data-hide="false" data-console="false" data-babel="false">
;
<div^{cl2}$
;
<pre class="snippet-code-html lang-html prettyprint-override"><code><img src='some_url'></code></pre>
;
</div>
;
</div>
;
<p>标签。你有所有的img标签吗汤。全部找到('img'),将所有URL提取到实际文件并下载它们。你知道吗</p>
<p>现在你正在寻找这样的标签</p>
<p/><div class="snippet" data-lang="js" data-hide="false" data-console="false" data-babel="false">
;
<div^{cl2}$
;
^{pr2}$
;
</div>
;
</div>
;
<p>URL包含“.doc”。像这样的事情应该可以做到:</p>
<pre><code>soup.select('a[href*=".doc"]')
</code></pre>