Python:requests.get，循环迭代url

import requests import json team_id = 1610612737 def get_data(url): response = requests.get(url) if response.status_code == 200: data = response.json() return data else: print(response.text) print(response.status_code) for i in range(30): # 30 NBA Teams base_url = "http://stats.nba.com/stats/teamdetails?teamID=" team_url = base_url + str(team_id) data = get_data(team_url) ## Do stuff ## team_id +=1

1条回答

网友

1楼 · 发布于 2024-05-19 03:38:35

网站限制每秒的请求数，因此您需要包含特定的请求头或在脚本中添加延迟（第一个选项是这两个选项中最快和最可靠的）。

Headers方法：

'''
add under team_id = 1610612737
'''

HEADERS = {'user-agent': ('Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_5)'
                          'AppleWebKit/537.36 (KHTML, like Gecko)'
                          'Chrome/45.0.2454.101 Safari/537.36'),
                          'referer': 'http://stats.nba.com/scores/'}

然后将此添加到您的响应get：

response = requests.get(url, headers=HEADERS)

*如果使用此方法，则根本不需要延迟脚本。

延迟方法：

import time
time.sleep(10) # delays for 10 seconds (put in your loop)

似乎是击中或错过使用延迟，所以我不建议使用，除非绝对必要。

Headers方法：

延迟方法：

相关问题更多 >

编程相关推荐

热门问题

热门文章