Python Beautifulsoup访问标签中的文本?

2024-10-01 04:49:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我在查找和返回出现在<b>标记中的值时遇到问题,我在读取任何标记时都没有运气。在

我不想发布上百行的查看源信息,也不确定如何正确地发布到它的链接,但这里是网页,如果你可以自己查看页面源http://yugiohprices.com/card_price?name=Dark+Magician

我要检索的信息 https://postimg.org/image/5fwxfqjqf/

这是我使用的代码

import requests
from bs4 import BeautifulSoup
r = requests.get('http://yugiohprices.com/card_price?name=Dark+Magician'); 
soup = BeautifulSoup(r.content, "lxml")
print soup.find('b').text

这是输出

家 |前100张|浏览卡|浏览集

采购统计 |观察表|卡片价格表

卖我的卡|价格提醒|博客|常见问题解答|设置

无论我做什么更改或尝试,我都无法访问“LDK2-ENY10”文本


Tags: name标记importcom信息httpcardrequests
1条回答
网友
1楼 · 发布于 2024-10-01 04:49:46

您可以看到页面需要一段时间来加载数据,数据是通过Ajax请求请求的,因此请求返回的不是您在浏览器中看到的内容。您可以通过一个简单的get to http://yugiohprices.com/get_card_prices/Dark+Magician,传递一个时间戳来模拟ajax请求:

import requests
from time import time

r = requests.get("http://yugiohprices.com/get_card_prices/Dark+Magician?_={}".format(int(time())))

print(r.content)

您将看到的是关于该卡的所有详细信息,因此要获得所需内容,只需使用href/浏览集开始找到?设置

^{pr2}$

相关问题 更多 >