抓取动态网页(ASPX)

2024-09-30 01:27:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我想把土耳其超级联赛的所有比赛细节都整理出来。 数据在这里:http://www.mackolik.com/Standings/Default.aspx?sId=3170

点击“Fikstür”,然后选择“Hafta”。 Fikstür在土耳其语中是Fikstür的意思,Hafta是week的意思。在

在这个页面中,当您在分数,即,当您选择Hafta=1时,“GenclerbirliĞi-Adaletspor”的匹配id为342212。在

所以,第一项工作是收集所有匹配ID。 当我想完全获得这些id时,我检查了所有元素。一个月前,我可以从www.mackolik.com/AjaxHandlers/FixtureHandler.aspx?command=getMatches&id=3170&week=11,可以通过网络获取。在

但当我进入那里时,我收到一条信息“403禁止错误”。但所有的身份证都在这里。我如何获得这些匹配ID或处理问题?在

我用的是Python。在


Tags: 数据comidhttpdefaultwww细节week
1条回答
网友
1楼 · 发布于 2024-09-30 01:27:06

我找到了解决办法:

import mechanize
from lxml import html as lh
import requests

br = mechanize.Browser()
page=br.open("http://www.mackolik.com/Standings/Default.aspx?sId=3170")
head=page.info().headers
response = requests.get('http://www.mackolik.com/AjaxHandlers/FixtureHandler.aspx?command=getMatches&id=3170&week=1', headers=head)
response.text

相关问题 更多 >

    热门问题