python3，beautifulsoup4，刮取并打印特定部分的文本

import time import requests import re from bs4 import BeautifulSoup Aniday = time.strftime("%B %d") r = requests.get("http://www.animefansftw.com") r.content soup = BeautifulSoup(r.content, "html.parser") print("Today's Animu Crack:\n") for div in soup.find_all("div", {"class": "date"}): get_date = div.text clean_date = " ".join(get_date.split()) if clean_date == Aniday: print(clean_date)

1条回答

网友

1楼 · 发布于 2024-10-01 09:20:01

看一下源代码，h1标记似乎包含在父级的父级中。你知道吗

尝试：

import time
import requests
import re
from bs4 import BeautifulSoup

Aniday = time.strftime("%B %d")
r = requests.get("http://www.animefansftw.com")  
r.content
soup = BeautifulSoup(r.content, "html.parser")
print("Today's Animu Crack:\n")

for div in soup.find_all("div", {"class": "date"}):
    get_date = div.text
    clean_date = " ".join(get_date.split())
    if clean_date == Aniday:
        post_div = div.parent.parent
        title = post_div.h1.text.encode('ascii','ignore')
        print("{title}\n{date}\n".format(title=title,date=clean_date))

相关问题更多 >

编程相关推荐

热门问题

热门文章

python3，beautifulsoup4，刮取并打印特定部分的文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >