如何使用BeautifulSoup提取带有datareactid的span内容？

from bs4 import BeautifulSoup import requests url='https://finance.yahoo.com/quote/TXG?p=TXG&.tsrc=fin-srch' wb_data=requests.get(url) soup=BeautifulSoup(wb_data.text,'lxml') cap = soup.find("span", class_ = "Trsdu(0.3s) ").get_text() print(cap)

2条回答

网友

1楼 · 编辑于 2024-06-26 14:00:18

试试这个：

from bs4 import BeautifulSoup
import requests
url='https://finance.yahoo.com/quote/TXG?p=TXG&.tsrc=fin-srch'
wb_data=requests.get(url)
soup=BeautifulSoup(wb_data.text,'lxml')
cap = soup.find("span", class_ = "Trsdu(0.3s) ").get('data-reactid')
print(cap)

网友

2楼 · 编辑于 2024-06-26 14:00:18

find函数将任何未知关键字参数视为属性过滤器，因此要查找其id属性为foo的元素，您可以编写：

soup.find(id = "foo")

不能直接将data-class用作关键字参数，因为连字符使其在Python中成为非法标识符。但是美丽的乌苏has you covered：

cap = soup.find("span", class_ = "Trsdu(0.3s) ", attrs = {"data-reactid": "85"})

请注意，依赖React id可能非常脆弱，因此最好依赖周围的元素，比如“市值”标签

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用BeautifulSoup提取带有datareactid的span内容？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >