为什么这段代码中的httpresponse的html文件不完整？

import requests from bs4 import BeautifulSoup source = requests.get("https://www.evaschulze-aufgabenpool.de/index.php/s/smwP6ygck2SXRtF").text soup = BeautifulSoup(source, "html.parser") for table in soup.find_all("table"): print(table)

1条回答

网友

1楼 · 发布于 2024-09-29 23:20:42

发生了什么事？

表的内容是动态生成的，不包括在请求的响应中。您必须等待页面/内容加载

你能做的就是使用硒

from selenium import webdriver
from bs4 import BeautifulSoup
from time import sleep

url = "https://www.evaschulze-aufgabenpool.de/index.php/s/smwP6ygck2SXRtF"

driver = webdriver.Chrome(executable_path=r'C:\Program Files\ChromeDriver\chromedriver.exe')

driver.get(url)
#driver.implicitly_wait(10) 
sleep(3)
soup = BeautifulSoup(driver.page_source,"lxml")

for table in soup.find_all("table"):
    print(table)

driver.close()

编程相关推荐

使用SeleniumWebDriver（又称Selenium2.0）JAVA向下滚动鼠标
java获取与消费者组kafka关联的主题列表
java在现实生活中，您什么时候会使用堆栈而不是常规链表，或者使用常规队列而不是优先级队列？
java实际参数列表和形式参数列表的长度不同（但两种长度都是2？）
默认情况下，Lucene（java框架）是否根据术语计算文档的tfidf和余弦相似性？
java编辑XML样式表更改Android中的按钮
java在Eclipse4中从处理程序更新视图
java是节点列表、数组、列表还是其他什么？
java Hibernate查询问题
java Spark在并行化列表时引发ArrayIndexOutOfBoundsException

相关问题更多 >

编程相关推荐

热门问题

热门文章

为什么这段代码中的httpresponse的html文件不完整？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >