正在尝试选择id在scrapy中不起作用的div标记

2024-09-30 00:22:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我是个新手,不太会刮东西。我试图在Amazon上抓取一个项目,为此我尝试用id抓取div,但没有得到任何输出

response.xpath('//*[@id="widgetContent"]')

但它什么也没回来。我甚至尝试了更多的div来使用id进行选择,但我猜我做得不对,因为它返回了一个空列表。 以下是完整声明:

xpath('/html/body/div[1]/div[9]/div[1]/div[3]/div/div[2]/div/div/div')

这个也不行。你知道吗

有人能帮我吗?我想我在哪里犯了个错误。你知道吗

我试过用漂亮的汤,但不起作用。。。。你知道吗

from urllib.request import Request,urlopen
page=urlopen('https://www.amazon.in/gp/goldbox/ref=gbps_ftr_s-5_9f8e_page_1?gb_f_c2xvdC01=enforcedCategories:5122348031%252C1380375031%252C1571274031%252C1355016031%252C976389031%252C1388977031%252C4772060031%252C1953148031%252C1967851031%252C1967936031%252C1968024031%252C1953602031%252C1571271031%252C1375344031%252C976392031%252C1375393031%252C976419031%252C1388867031%252C1380441031%252C2454175031%252C2454178031%252C1983338031%252C1388921031%252C2563505031%252C2563504031%252C1968401031%252C1350384031%252C1380374031%252C976442031%252C1389335031%252C1380510031%252C1951048031%252C1350380031%252C1380442031%252C3704992031%252C1375412031%252C1634753031%252C5925789031%252C2454169031%252C1389402031%252C3677697031%252C2454172031%252C2454181031%252C1389365031%252C1984443031%252C1967862031%252C1967947031%252C1968036031%252C976460031%252C1350387031%252C2563506031%252C1375392031%252C5866078031%252C1389177031%252C3704982031%252C1389375031%252C1374515031%252C1380485031%252C1375424031%252C1983320031%252C1389432031%252C1389433031%252C976445031%252C1375427031%252C976451031%252C1983397031%252C1374594031%252C1983518031%252C1389396031%252C1983578031%252C1375458031,dealTypes:LIGHTNING_DEAL%252CBEST_DEAL,discountRanges:70-,includedAccessTypes:KINDLE_CONTENT_DEAL,sortOrder:BY_SCORE&pf_rd_p=b4500f5f-e496-4b18-ab75-623b14149f8e&pf_rd_s=slot-5&pf_rd_t=701&pf_rd_i=gb_main&pf_rd_m=A1VBAL9TL5WCBF&pf_rd_r=M7CSGXF54FR9QVVN9RSQ&nocache=1573918369538&ie=UTF8')

page_html=page.read()
page_soup=BeautifulSoup(page_html,'html.parser')
page_soup.find('div',{'id':'widgetContent'})```

Tags: dividamazonhtmlpagerdxpathurlopen
1条回答
网友
1楼 · 发布于 2024-09-30 00:22:36

您可以使用css选择器以一种简单的方式response.css("#widgetContent ::text")实现这一点。 这也会起作用response.xpath('//div[(@id="widgetContent")])

相关问题 更多 >

    热门问题