我试图从Python异步返回一个XHR URL列表。下面是我的代码
import asyncio
from pyppeteer import launch
async def intercept_response(res):
resourceType = res.request.resourceType
xhr_list = []
if resourceType in ['xhr']:
print(res.request.url)
xhr_list.append(res.request.url)
return xhr_list
async def main():
browser = await launch(headless=False)
page = await browser.newPage()
page.on('response', intercept_response)
await page.setUserAgent('Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1')
await page.goto('https://www.iesdouyin.com/share/user/70015326114', waitUntil = 'networkidle2')
await browser.close()
if __name__ == '__main__':
url = asyncio.run(main())
print(url)
然而,当我运行代码时,res.request.url被打印出来,但是xhr_列表没有返回,导致url为None。我的代码有问题吗
您的代码有两个问题。首先,
intercept_response
尝试构造一个列表,但该列表总是新创建的,并且最多由一个元素组成。由于intercept_response
被多次调用,它应该附加到相同的列表中此外,您需要确保
intercept_response
的返回值传播到main
,并从那里实际返回它。例如,您可以使用一个闭包(内部def
),该闭包分配给外部范围中定义的变量:相关问题 更多 >
编程相关推荐