从搜索结果中找到一个链接列表

import bs4 as bs import urllib.request, urllib.error, urllib.parse from http.cookiejar import CookieJar from bs4 import Comment cj = CookieJar() basisurl = 'http://mz-villigst.cidoli.de/index.asp?stichwort=hans' #just took any example page similar to the one i have in mind opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj)) p = opener.open(basisurl) for mednrs in soup.find_all(string=lambdatext:isinstance(text,Comment)): #and now when i do [0:] it gives me the medianumbers and i can create the links like this: links = 'http://mz-villigst.cidoli.de/index.asp?MEDIENNR=' + mednrs[10:17]

1条回答

网友

1楼 · 发布于 2024-10-04 03:16:50

创建一个列表并将其附加到循环中：

links = []
for mednrs in soup.find_all(string=lambda text: isinstance(text, Comment)):
    link = 'http://mz-villigst.cidoli.de/index.asp?MEDIENNR=' + mednrs[10:17]
    links.append(link)

或者使用列表：

links = ['http://mz-villigst.cidoli.de/index.asp?MEDIENNR=' + mednrs[10:17]
         for mednrs in soup.find_all(string=lambda text: isinstance(text, Comment))]

相关问题更多 >

编程相关推荐

热门问题

热门文章