从magibricks.com刮取数据

2024-09-28 01:24:42 发布

您现在位置：Python中文网/ 问答频道 /正文

5442

网友

男 | 程序猿一只，喜欢编程写python代码。

我正试图从magicbricks.com上获取数据但是，当我试图通过手动单击页面底部的第二个页面来更改页面时，页面链接保持不变。我得到了同样的数据。如何加载剩余页面

例如：这是第一页的链接

https://www.magicbricks.com/property-for-sale/residential-real-estate?bedroom=1,2,3,4,5,%3E5&proptype=Multistorey-Apartment,Builder-Floor-Apartment,Penthouse,Studio-Apartment,Residential-House,Villa,Residential-Plot&cityName=Mumbai

第二页的链接是相同的，只是页面内容发生了变化

import pandas as pd
from pandas import ExcelWriter
import requests,re,csv
from bs4 import BeautifulSoup

for i in range(1,5):      # Number of pages plus one 

   url = "https://www.magicbricks.com/property-for-sale/residential- 
   real-estate?bedroom=1,2,3,4,5,%3E5&proptype=Multistorey- 
   Apartment,Builder-Floor-Apartment,Penthouse,Studio- 
   Apartment,Residential-House,Villa,Residential- 
   Plot&cityName=Mumbai".format(i);

   r = requests.get(url)
   soup = BeautifulSoup(r.content)

我想搜刮这个网站的500个条目

Tags： https import com for 链接 www property 页面

1条回答

网友

1楼 · 发布于 2024-09-28 01:24:42

试着用硒来做这个 browser.execute_脚本（“window.scrollTo（0，document.body.scrollHeight）；”）和这段代码一起滚动

从magibricks.com刮取数据

相关问题更多 >

编程相关推荐

热门问题

热门文章

从magibricks.com刮取数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >