如何从特定网站中获取数据

3条回答

网友

1楼 · 编辑于 2024-10-03 15:30:38

使用lxml或html.parser解析HTML。有些比另一些有优势，包括lxml非常快

URL = 'https://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg'
page = requests.get(URL) 
from bs4 import BeautifulSoup
soup = BeautifulSoup(page.text, "html.parser") #or lxml, htmlparser is just example

与其不使用字符串直接将其放入，不如将其与字符串一起放入，以便Python知道您正在处理解析器

网友

2楼 · 编辑于 2024-10-03 15:30:38

试一试

soup = BeautifulSoup(page.text, "html.parser")

网友

3楼 · 编辑于 2024-10-03 15:30:38

要创建BeautifulSoup对象，请执行以下操作：

soup = BeautifulSoup(page.text, "lxml")

或者

soup = BeautifulSoup(page.text, "html.parser")

或者

soup = BeautifulSoup(page.content, 'html.parser')

我认为，您应该使用lxml，因为它具有良好的性能

编程相关推荐

试图从数组返回的列表中删除时出现java UnsupportedOperationException。asList
JAVA搜索列表字段
Java将布尔[]转换为十进制
为什么这个循环会在Java中反转字符串
Arraylist索引计算java
java如何在不知道值的情况下选择selenium中的复选框
Java如何在for循环中使用getter？
java不希望下载和检索XML
java读取csv文件，并在值本身中指定分隔符
java如何使字符串在循环中第二次不可用？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从特定网站中获取数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >