我是新的网络抓取,我正试图自动检索包裹信息从一个城镇网站。我有300多个包裹需要这本书和页码
当你去那里时,你可以点击搜索,然后我会输入标识符(例如68/20)。我有所有这些的清单。从那里的个人资料来了,我可以得到书和页码
这就是我目前所拥有的
from bs4 import BeautifulSoup
from urllib.request import urlopen
url = "https://newmilfordct.mapgeo.io/datasets/properties?abuttersDistance=100&latlng=41.587864%2C- 73.425014"
page = urlopen(url)
html = page.read().decode("utf-8")
soup = BeautifulSoup(html, "html.parser")
我连接到该网站,但我不知道如何与之互动。 如果有人能在正确的方向上帮助我,我们将不胜感激,并且可以节省人工工作时间
您可以通过向
API
url发送POST
请求来获取给定标识符的数据以下是如何做到这一点:
输出:
JSON中还有更多内容。只需取消注释这一行
# print(search_results)
即可获得整个响应编辑:关于
API
的简短说明当您将标识符放入web浏览器中开发人员工具的搜索字段时,您可以偷偷地看一看发生了什么。然后转到
Network
选项卡并选择XHR
过滤器选择第一项并选择
Headers
。在那里你可以找到Request URL
和Request payload
相关问题 更多 >
编程相关推荐