我试图从一个列表(大约1500个条目)中获取一个URL,然后使用python的twilllib逐个访问它们。我使用twill的原因是因为我喜欢它,以后可能要执行基本的表单填充。在
我遇到的问题是声明循环的内容。 我相信这个问题其实很容易解决,但我现在还没有想到解决办法。在
from twill.commands import *
CONTAINER = open('urls.txt') #opening file
CONTAINER_CONTENTS = CONTAINER.readlines() #reading
CONTAINER_CONTENTS = map(lambda s: s.strip, CONTAINER_CONTENTS) #this is just to remove the ^N (newline) that was appended to each URL
for i in CONTAINER_CONTENTS:
<educate me>
..
go(url)
etc.
提前谢谢。在
相关问题 更多 >
编程相关推荐