我正在使用python和beautifulsoup模块aka bs4。我正在抓取的页面具有以下格式:
<div class="Halls_spec">
<b>Hall1</b> Thurs.-Wedn.: 21.30
我使用以下代码获取信息:
movie_date = table.select_one("div.Halls_spec")
movieDate=(movie_date.text.strip())
这里我得到以下字符串:Hall1 Thurs.-Wedn. 21.30
我应该如何分别获得大厅名称和日期值
Tags:
您可以使用b标记和下一个兄弟来提取日期
或者您可以使用next_elements来获取可以迭代的生成器对象:
相关问题 更多 >
编程相关推荐