我目前正试图从拉扎达电子商务平台刮产品的网址,但我得到的是从网站的随机链接,而不是产品链接。在
https://www.lazada.com.my/oldtown-white-coffee/?langFlag=en&q=All-Products&from=wangpu&pageTypeId=2
我的代码如下:
from bs4 import BeautifulSoup, SoupStrainer
import requests
url = "https://www.lazada.com.my/oldtown-white-coffee/?langFlag=en&q=All-
Products&from=wangpu&pageTypeId=2"
page = requests.get(url)
data = page.text
soup = BeautifulSoup(data)
links = soup.find_all('div', {'class': 'c16H9d'})
for link in soup.find_all("a"):
print(link.get("href"))
我从这个代码中得到的结果(这不是我想要的):
这是我需要的链接部分,我想从产品页面列出所有产品的网址。在
我希望你们能在这方面帮我,我知道这很简单,只是似乎不起作用,从昨天开始就在看这个。在
页面是动态的。在html源代码中是生成产品json格式的脚本。您可以提取它,然后解析json对象以打印出url:
输出:
^{pr2}$相关问题 更多 >
编程相关推荐