为什么在Beautifulsoup中选择一个函数会返回无值

import bs4 as bs import urllib.request import pandas as pd from requests_html import HTMLSession review_dict = {'review':[], 'author':[]} page = 1 while page != 10: session = HTMLSession() url = 'https://www.goodreads.com/book/show/2932708?from_search=true&from_srp=true&qid=OOQwYQkG9A&rank=1' + str(++page) grURL = session.get(url) soup = bs.BeautifulSoup(grURL.content, 'html.parser') prod_containers = soup.find('div', id = 'lazy_loadable_view') firstelement = prod_containers.find_all('div', attrs={'class': 'left bodycol'}) for rows in firstelement: review = rows.select_one('p > div.reviewText stacked > span.readable > span') author = rows.select_one('p > div.reviewHeader uitext stacked > span > a[title]') review_dict['review'].append(review) review_dict['author'].append(author) if page == 10: break page += 1 sword_reviews = pd.DataFrame(review_dict) sword_reviews

1条回答

网友

1楼 · 发布于 2024-09-28 17:28:34

要获取所需的数据，需要更改select_one中的搜索字符串。用“.”连接多个类

请尝试以下代码：

import bs4 as bs
import urllib.request
import pandas as pd
from requests_html import HTMLSession


review_dict = {'review':[], 'author':[]}

page = 1

while page != 10:
    session = HTMLSession()

    url = 'https://www.goodreads.com/book/show/2932708?from_search=true&from_srp=true&qid=OOQwYQkG9A&rank=1' + str(++page)

    grURL = session.get(url)

    soup = bs.BeautifulSoup(grURL.content, 'html.parser')
    prod_containers = soup.find('div', id = 'lazy_loadable_view')
    firstelement = prod_containers.find_all('div', attrs={'class': 'left bodycol'})
    
    for rows in firstelement:
        review = rows.select_one('div.reviewText.stacked > span.readable > span')
        author = rows.select_one('div.reviewHeader.uitext.stacked > span > a[title]')
        review_dict['review'].append(review)
        review_dict['author'].append(author)

    if page == 10:
        break
    page += 1
    
sword_reviews = pd.DataFrame(review_dict)

print(sword_reviews)

相关问题更多 >

编程相关推荐

热门问题

热门文章