Python beauthulsoup find_all（）在for循环中不起作用

import requests, os from bs4 import BeautifulSoup directory = os.path.normpath("C:\\Users\x\\Desktop\\names.txt") f = open(directory, 'r', encoding='utf8') x = f.readlines() for line in x: s = line.split(",")[0].replace(" ","") n = line.split(",")[1].replace(" ","") print(s + " " + n) res = requests.get('http://www.scopus.com/results/authorNamesList.uri? origin=searchauthorlookup&src=al&edit=&poppUp=&basicTab=&affiliationTab=&advancedTab=&st1=' + s + '&st2=' + n + '&institute=&orcidId=&authSubject=LFSC&_authSubject=on&authSubject=HLSC&_authSubject=on&authSubject=PHSC&_authSubject=on&authSubject=SOSC&_authSubject=on&s=AUTH--LAST--NAME%28' + s + '%29+AND+AUTH--FIRST%28' + n + '%29&sdt=al&sot=al&searchId=81BECD653C7453F7BFBBB1CD8D8E5B04.wsnAw8kcdt7IPYLO0V48gA%3A220&exactSearch=off&sid=81BECD653C7453F7BFBBB1CD8D8E5B04.wsnAw8kcdt7IPYLO0V48gA%3A220') content = res.content soup = BeautifulSoup(content, 'lxml').find_all('div', {'class':'dataCol2'}) for item in soup: print(item.text) break

1条回答

网友

1楼 · 发布于 2024-09-28 05:44:24

它按预期工作：

import requests, os
from bs4 import BeautifulSoup


x=["Aaroe, L","Abbas, Z","Abbott, G"]

for line in x:
    l=line.split(',')
    s=l[0].strip()
    n=l[1].strip()
    print("                  ")
    print("FirstName: "+s + ", Last Name: " + n)
    res = requests.get('http://www.scopus.com/results/authorNamesList.uri?origin=searchauthorlookup&src=al&edit=&poppUp=&basicTab=&affiliationTab=&advancedTab=&st1=' + s + '&st2=' + n + '&institute=&orcidId=&authSubject=LFSC&_authSubject=on&authSubject=HLSC&_authSubject=on&authSubject=PHSC&_authSubject=on&authSubject=SOSC&_authSubject=on&s=AUTH LAST NAME%28' + s + '%29+AND+AUTH FIRST%28' + n + '%29&sdt=al&sot=al&searchId=81BECD653C7453F7BFBBB1CD8D8E5B04.wsnAw8kcdt7IPYLO0V48gA%3A220&exactSearch=off&sid=81BECD653C7453F7BFBBB1CD8D8E5B04.wsnAw8kcdt7IPYLO0V48gA%3A220')   
    content = res.content    
    soup = BeautifulSoup(content, 'lxml').find_all('div', {'class':'dataCol2'})
    for item in soup:
        print(item.text.strip())
        break

输出：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章