在Beautifulsoup中查找web文章中的某些名词

2024-05-19 17:38:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我用Beautifulsoup搜刮了几篇网络文章。在把这些都删掉之后,我想知道这篇文章所说的是哪个国家。我目前的方法是这样的
-从该文章中提取原始文本
-列出列表中所有195个国家的列表
-在Beautifulsoup中使用findall()函数检查发生的次数

def find_country(url_string):
     html = urlopen(url_string)
     bsObj = BeautifulSoup(html)

     countryList = bsObj.find_all("p", string="UK")
     print(len(countryList))

我在这样的网站上尝试过:https://www.bbc.co.uk/news/uk-politics-52701843,但没有得到正确的结果。
然而,我在网上读到一篇文章,详细说明了应该从哪个家长/孩子那里获得信息。i、 e我想在新闻网站的

区域获得UK。然而,我想知道我将如何实现这一点。这样find_all('p',string=UK)就可以在新闻文章中找到正确数量的关键字UK。
谢谢你的帮助,非常感谢


Tags: url列表string网站html文章国家all