擅长:python、mysql、java
<p>对于bs4.7.1,可以使用:not和:contains伪类选择器来指定包含特定文本时要排除的段落。在本例中,我将通过扩展页面中的排除测试文本并添加id来限制文章内容,从而使其更加健壮。你知道吗</p>
<pre><code>from bs4 import BeautifulSoup as bs #4.7.1
import requests
r = requests.get('https://nasional.tempo.co/read/1216914/moeldoko-penangguhan-penahanan-soenarko-bisa-diterima/full&view=ok')
soup = bs(r.content, 'lxml')
paras = [p.text for p in soup.select('#isi p:not(:contains("Baca juga:"))')]
print(paras)
</code></pre>