挖掘古腾堡项目,无法创建对子目录的访问

2024-10-01 22:38:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试创建一个循环,用Python脚本访问Gutenberg项目镜像存档。我遇到的问题是,我可以创建propoer循环,因为子目录会改变。例如: http://mirror.its.dal.ca/gutenberg/1/11/11.txthttp://mirror.its.dal.ca/gutenberg/2/22/23.txt

等等。我正在使用这个脚本,但它会开始移动数字,导致子目录与文件不再匹配:

http://mirror.its.dal.ca/gutenberg/2/23/23.txt
http://mirror.its.dal.ca/gutenberg/2/24/24.txt
http://mirror.its.dal.ca/gutenberg/2/25/25.txt
http://mirror.its.dal.ca/gutenberg/2/26/26.txt
http://mirror.its.dal.ca/gutenberg/2/27/27.txt
http://mirror.its.dal.ca/gutenberg/2/28/28.txt
http://mirror.its.dal.ca/gutenberg/3/29/29.txt
http://mirror.its.dal.ca/gutenberg/3/30/30.txt

我使用的是这种基本循环:

liston = [ 1, 2, 3, 4 , 5,6,7,8,9,]
pos = 10
luve= [1, 2,3,4,5,6,7,8,9]
les = 0
for y in luve:

    les = les +1


    for x in liston:
        pos = pos + 1


        print "http://mirror.its.dal.ca/gutenberg/"+str(les)+"/"+str(pos)+"/"+str(pos)+".txt"

非常感谢。你知道吗


Tags: inpostxt脚本httpformirrorca

热门问题