我正在用Python进行一些web抓取,遇到了一个奇怪的错误。有时,当我试图使用URL打开和读取html文件时,会出现以下错误:
'IOError: [Errno 2] No such file or directory'
产生这个错误的代码在这里:终端不喜欢这段代码中的最后一行。在
^{pr2}$列表games
是绝对存在的url的列表。这是我打印出来的games
的样子:
['nba.com/games/20160323/ATLWAS/gameinfo.html',
'nba.com/games/20160323/MILCLE/gameinfo.html',
'nba.com/games/20160323/TORBOS/gameinfo.html',
'nba.com/games/20160323/ORLDET/gameinfo.html',
'nba.com/games/20160323/NYKCHI/gameinfo.html',
'nba.com/games/20160323/UTAHOU/gameinfo.html',
'nba.com/games/20160323/SACMIN/gameinfo.html',
'nba.com/games/20160323/MIASAS/gameinfo.html',
'nba.com/games/20160323/PHIDEN/gameinfo.html',
'nba.com/games/20160323/LALPHX/gameinfo.html',
'nba.com/games/20160323/DALPOR/gameinfo.html',
'nba.com/games/20160323/LACGSW/gameinfo.html']
有人知道我为什么会犯这个错误吗?事实上,我以前也遇到过这个错误,虽然我在那一次解决了它,但我不明白为什么我所做的有效,所以我想问问社区。以前,我设置了games
,这样它就没有完整的URL,而是只有它的一部分。在
例如,旧的games
中的第一个元素是/games/20160323/ATLWAS/gameinfo.html
。然后在上面显示的for循环中,我没有url = game
,而是写了nba.com+url
。当我使用上面概述的更改运行它时,它按预期运行。
任何帮助都将不胜感激。在
Python 2:
(对于python3,必须包含.request)
^{pr2}$相关问题 更多 >
编程相关推荐