如何从烂番茄上刮下一页以上的评论？

import selenium from selenium import webdriver import pandas as pd driver = webdriver.Chrome() driver.get("https://www.rottentomatoes.com/m/avengers_endgame/reviews") review_1df = pd.DataFrame(columns=['Date', 'Reviewer', 'Website', 'Review', 'Score']) dates = [] reviews = [] scores = [] newscores = [] names = [] sites = [] results = driver.find_elements_by_class_name("review_area") reviewnum = 1 reviewers = driver.find_elements_by_class_name("col-xs-8") for r in results: dates.append(r.find_element_by_class_name('subtle').text) reviews.append(r.find_element_by_class_name('the_review').text) revs = r.find_element_by_class_name('review_desc') scores.append(revs.find_element_by_class_name('subtle').text) for r in reviewers: names.append(r.find_element_by_xpath('//*[@id="reviews"]/div[2]/div[4]/div[' +str(reviewnum)+ ']/div[1]/div[3]/a[1]').text) sites.append(r.find_element_by_xpath('//*[@id="reviews"]/div[2]/div[4]/div[' +str(reviewnum)+']/div[1]/div[3]/a[2]/em').text) reviewnum+=1 for score in scores: if score == ('Full Review'): newscores.append('no score') else: score2 = score[14:] newscores.append(score2) review_1df['Date'] = dates review_1df['Review'] = reviews review_1df['Score'] = newscores review_1df['Reviewer'] = names review_1df['Website'] = sites

1条回答

网友

1楼 · 发布于 2024-09-30 16:25:31

您可以使用URL参数进入下一页的评论，并重复相同的步骤。例如，以下url将带您进入评论的第二页：

https://www.rottentomatoes.com/m/avengers_endgame/reviews?type=&sort=&page=2

注意参数是type=&sort=&page=2，您还可以在其中指定排序和类型。将其更改为page=3以进入第三页

您还必须添加一个检查，以查看该页面是否存在。例如，您将不会收到此URL的任何评论：

https://www.rottentomatoes.com/m/avengers_endgame/reviews?type=&sort=&page=200000

相关问题更多 >

编程相关推荐

热门问题

热门文章