使用python在html网站上查找视频id

2条回答

网友

1楼 · 编辑于 2024-09-29 23:22:16

假设数据id在div

BeautifulSoup.find将找到的html元素作为字典返回给您。因此，您可以使用标准方法来导航它，以访问文本（正如您在问题中所做的）以及html标记（如下面的代码所示）

soup = BeautifulSoup('<div class="_article" data-id="qe67234">')
soup.find("div", {"class":"_article"})['data-id']

请注意，通常情况下，视频元素需要JS来播放，如果使用非javascript客户机（即pythonrequests）对其进行刮取，则可能无法找到必需的元素

如果发生这种情况，您必须使用phantomjs + seleniumbrowser之类的工具将网站与javascript结合起来，以执行抓取

编辑如果data-id标记本身不是常量，则应该查看lxml库以替换BeautifulSoup，并使用xpath值来查找所需的元素

网友
2楼 · 编辑于 2024-09-29 23:22:16

假设data id的标记以div开头：
from bs4 import BeautifulSoup import re soup = BeautifulSoup('<div class="_article" data-id="qe67234"></div>') results = soup.findAll("div", {"data-id" : re.compile(r".*")}) print('output: ', results[0]['data-id']) # output: qe67234

相关问题更多 >

编程相关推荐

热门问题

热门文章