bs4 BeautifulSoup找不到看起来像是拯救我生命的自定义标签

3条回答

网友

1楼 · 编辑于 2024-10-02 00:38:44

.find()的工作方式与其他标签（如div、p和a）的工作方式相同。因此，我们搜索“react”标记

react_tag = soup.find('react')

然后，像这样访问num属性

num_value = react_tag['num']

应打印：

网友

2楼 · 编辑于 2024-10-02 00:38:44

用户“sn”是正确的！这些是动态创建的javascript，我对此一无所知，但很容易理解。同时使用Python中的SeleniumLibrary和“headless”WebChromeDriver，您可以使用诸如Xpath等Selenium选择器来查找这些标记

网友

3楼 · 编辑于 2024-10-02 00:38:44

根据bs4 Documentation.find('tag')返回单个标记.find_all('tag')返回html格式的标记列表

在您的情况下，如果有多个react标记，请使用此选项

for reactTag in soup.find_all('react'):
    print(reactTag.get('num'))

要仅获取第一个标记，请使用此

print(soup.find('react').get('num'))