靓汤不饱

import requests from bs4 import BeautifulSoup url = "nsfw" r = requests.get(url) soup = BeautifulSoup(r.text, 'html.parser') cards = soup.find_all("div", {"class": "card-body"}) cards.pop(0) cards.pop(0) cards.pop(0) # i really like to pop texte = [] print(soup) for i, card in enumerate(cards): texte.append(card.text) if i == len(cards)-1: print(card)

2条回答

网友

1楼 · 编辑于 2024-10-05 14:26:25

似乎html.parser把DOM搞砸了。lxml-解析器适合我：

import requests
from bs4 import BeautifulSoup

url = "six-pack-thingy"
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')
cards = soup.find_all("div", {"class": "card-body"})
texte = [card.text for card in cards[3:]]

网友

2楼 · 编辑于 2024-10-05 14:26:25

我想我也可以发表我的涂鸦：

from selenium import webdriver

driver = webdriver.Firefox()
driver.get('six-pack-thingy')
elems = driver.find_elements_by_class_name('card-body')

texte = [t.text for t in elems[3:]]

不过，您需要一些webdriver来运行selenium。你熟悉吗？你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

靓汤不饱

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >