我正在通过刮imdb.com练习BeautifulSoup,对于一个给定的演员,我想
到目前为止,对于所有的电影,我都能得到类似以下汤的东西:
<div class="filmo-row even" id="actor-tt14677742">
<span class="year_column">2021</span>
<b><a href="/title/tt14677742/">Welcome Back Future</a></b>
(Short)
<br/>
Leo
</div>
正如我们所看到的,这部电影应该被过滤掉,因为它很短。我们还可以看到关于(Short)
的信息没有包装在任何标记中。
因此,我的问题是:
我如何从汤中获取这些信息,如果有任何信息,我如何在</b>
之后查找这些信息?
顺便说一句,我不知道你在找什么。但根据评论和其他答案
下面应该实现你的目标
输出:
我对
bs4
了解不多,但不知怎么的,我在寻找next_sibling
,这就解决了我的问题所以我这样做:
如果我发现我不需要的电影,因为它属于我不需要的类别之一,我会返回None,None。我知道这不是最好的代码风格,但它对我很有用
您可以使用以下选项:
我想你现在可以把它清理干净了,我相信会得到他们作为演员主演的所有电影的名单意味着你还需要
Leo
相关问题 更多 >
编程相关推荐