当数据表不在页面sou中显示时如何刮取

2条回答

网友

1楼 · 编辑于 2024-06-28 11:15:23

使用页面用于该内容的相同端点。您可以在浏览器的“网络”选项卡中找到它。你知道吗

import requests
from bs4 import BeautifulSoup as bs
import pandas as pd

r = requests.get('https://www.ijsselsteinloop.nl/uitslag/2019/index.html')
soup = bs(r.content, 'lxml')
links = ['https://www.ijsselsteinloop.nl/uitslag/2019/' + item['href'] for item in soup.select('[href^=uitslag]')]

for link in links:
    table = pd.read_html(link)[0]
    print(table)

网友

2楼 · 编辑于 2024-06-28 11:15:23

你可以用美丽之声。首先：

uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html,"html.parser")

然后使用函数找到。全部（获取每个tr）。然后使用for循环，并键入再次查找（'td'）以获取每一行

编程相关推荐

java垂直解析txt文件
如何在从ovf部署vm时使用vi java api指定IP地址？
使用部分密钥进行java AES256解密
我无法接收RESTJava ws作为JSONObject发送到我的安卓应用程序的布尔值
java以下同步块的目的是什么？
java小部件在进入应用程序时停止更新
java如何在Okhttp中使用Socks5代理来启动http请求
java Android多资源库项目
java使用条形码4J创建gif条形码
java Play测试数据持久性问题使用GET时，发布的数据不可用

相关问题更多 >

编程相关推荐

热门问题

热门文章

当数据表不在页面sou中显示时如何刮取

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >