用Python抓取网页如何解析表格

2024-09-28 22:50:00 发布

男 | 程序猿一只，喜欢编程写python代码。

如何使用BeautifulSoup从https://ege.hse.ru/rating/2019/81031971/all/?rlist=&ptype=0&vuz-abiturients-budget-order=ge&vuz-abiturients-budget-val=10解析表并生成数据帧？我的代码：

import requests
from bs4 import BeautifulSoup
url = 'https://ege.hse.ru/rating/2019/81031971/all/?rlist=&ptype=0&vuz-abiturients-budget-order=ge&vuz-abiturients-budget-val=10'
page = requests.get(url)
soup = BeautifulSoup(page.content,"html.parser")
table = soup.find_all("table")
for each_table in table:
 for row in each_table.find_all('tr'):
  for cell in row.find_all("td"):
   print(cell.text)

我试试这个：

import requests
from bs4 import BeautifulSoup
import pandas as pd

url = "https://ege.hse.ru/rating/2019/81031971/all/?rlist=&ptype=0&vuz-abiturients-budget-order=ge&vuz-abiturients-budget-val=10"
page = requests.get(url)

soup = BeautifulSoup(page.content, 'html.parser')

tbl = soup.find("table", {"id": "MainContent_dataGridView1"})

data_frame = pd.read_html(str(tbl))[0]
print(data_frame)

但它说：

"ValueError: No tables found"

Tags： https import url page table all find requests

1条回答

网友

1楼 · 发布于 2024-09-28 22:50:00

我只看到一个带有^{id1}的表$

因此：

tbl = soup.find("table", {"id": "transparence_t"})
data_frame = pd.read_html(str(tbl))[0]
print(data_frame)

它向我返回一个698x6数据帧

用Python抓取网页如何解析表格

相关问题更多 >

编程相关推荐

热门问题

热门文章

用Python抓取网页如何解析表格

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >