为什么Beautifulsoup.find（）没有给出具体的结果？

import requests as req from bs4 import BeautifulSoup usernames = #list of username location_list = [] for x in usernames: url= "https://twitter.com/" + x try: html = req.get(url) except Exception as e: print("Failed to") continue soup = BeautifulSoup(html.text,'html.parser') try: label = soup.find('span',{'class':"ProfileHeaderCard-locationText"}) label_formatted = label.string.lstrip() label_formatted = label_formatted.rstrip() if label_formatted != "": location_list.append(label_formatted) print(x + ' : ' + label_formatted) else: print('Not found') except: print('Not found')

3条回答

网友

1楼 · 编辑于 2024-10-04 03:23:24

看起来您正在搜索一个span标记，其class属性与您的查询类完全匹配。由于span有两个类，测试失败，没有返回结果

使用css selectors，您可以尝试以下解决方案：

from bs4 import BeautifulSoup as BS
soup = BS('''<span class="ProfileHeaderCard-locationText u-dir">.....</span>''', 'html.parser')
soup.select('span.ProfileHeaderCard-locationText')

返回包含指定类的span标记

see also

网友

2楼 · 编辑于 2024-10-04 03:23:24

您应该调用find，而不是find_all来获取单个元素。然后使用.text属性获取文本内容

label = soup.find('span',{'class':"ProfileHeaderCard-locationText"})
print(label.text)

网友

3楼 · 编辑于 2024-10-04 03:23:24

对于任何有相同问题的人，我都可以通过执行以下操作从html代码中获取innerdata：

label2 = soup.findAll('span',{"class":"ProfileHeaderCard-locationText"})[0].get_text（）

相关问题更多 >

编程相关推荐

热门问题

热门文章