(环境:Python 2.7+beauthulsoup 4.3.2)
我使用Python和BeautifulSoup来获取这个网页及其后续页面上的新闻标题。我不知道如何让它自动跟踪后续/下一页,所以我把所有的网址放在一个文本文件,web中列表.txt. 在
http://www.legaldaily.com.cn/locality/node_32245.htm
http://www.legaldaily.com.cn/locality/node_32245_2.htm
http://www.legaldaily.com.cn/locality/node_32245_3.htm
一。 . . 在
以下是我目前为止的解决方案:
^{pr2}$它会弹出一条错误消息,说明语法无效。在
出什么问题了?在
这是无效语法。在
如果要使用增广赋值运算符
^{pr2}$+=
,则加号和等号之间不能有空格。在下一个错误是:
因为在
soup =
行中使用url
之前从未定义过它。您可以通过直接迭代url列表来解决这个问题,而不是递增i
。在相关问题 更多 >
编程相关推荐