Python BeautifulSoup从网页抓取表

2024-09-30 01:34:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试从一个网页中获取数据,该网页有一个当前登录到该网站的用户表

我使用下面的代码登录到网站

browser = RoboBrowser()
loginURL = 'https://geico.aisreview.com/ais/admin.aspx'
browser.open(loginURL)
form = browser.get_form(id='form1')
form['txtPWD'].value = 'myPassword'
browser.submit_form(form)

我用这段代码试着从表中提取数据。现在我正试着打印出来做测试

^{pr2}$

我什么都不打印,但我什么也不打印。我可以确定for循环从未被输入,但我不知道为什么。在


Tags: 代码用户httpsbrowserrobobrowserformcom网页
1条回答
网友
1楼 · 发布于 2024-09-30 01:34:40

可以使用pandas.read_html从html读取表

import pandas as pd
import requests

loginURL='http://example.com'
res=requests.get(loginURL)

tables=pd.read_html(res.text) # return list of tables
print(tables)#will display all the tables, please slice the list for your required table.

或者,您可以直接给出url,如pd.read_html(loginURL)

相关问题 更多 >

    热门问题