如何正确使用split和Beautifulsoup？

from bs4 import BeautifulSoup as bs import requests import time import re r = requests.get("https://www.crummy.com/software/BeautifulSoup/bs4/doc/") soup = bs(r.content, "html.parser") qqrcoisa = soup.find("h1") print(qqrcoisa) lista = qqrcoisa.split(" ") print(lista)

3条回答

网友

1楼 · 编辑于 2024-10-01 17:21:32

为了避免抛出错误，可以运行以下操作：

from bs4 import BeautifulSoup as bs
import requests

r = requests.get("https://www.crummy.com/software/BeautifulSoup/bs4/doc/")
soup = bs(r.content, "html.parser")
qqrcoisa = soup.find("h1")
if qqrcoisa:
    print(f"Found this h1 element: {qqrcoisa.text}")
    lista = qqrcoisa.tetx.split(" ")
    print(f"Split h1 element: {lista}")
else:
    print("No h1 element found")

网友

2楼 · 编辑于 2024-10-01 17:21:32

您可以通过传递text将bs4元素转换为文本

qqrcoisa = soup.find("h1").text

如果要在<h1>和</h1>之间保留整行，可以将bs4元素转换为字符串

qqrcoisa = str(soup.find("h1"))

网友

3楼 · 编辑于 2024-10-01 17:21:32

将“文本”函数添加到查找函数：

qqrcoisa = soup.find("h1").text

这将为您提供：

Beautiful Soup Documentation¶

拆分后：

['Beautiful', 'Soup', 'Documentation¶']

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何正确使用split和Beautifulsoup？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >