将表解析为csv Python

2024-09-28 22:44:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要从https://ege.hse.ru/rating/2019/81031971/all/?rlist=&ptype=0&vuz-abiturients-budget-order=ge&vuz-abiturients-budget-val=10解析表

import requests

from bs4 import BeautifulSoup
import pandas as pd

url = "https://ege.hse.ru/rating/2019/81031971/all/?rlist=&ptype=0&vuz-abiturients-budget-order=ge&vuz-abiturients-budget-val=10"
page = requests.get(url)

soup = BeautifulSoup(page.content, 'html.parser')

tbl = soup.find("table", {"id": "transparence_t"})

data_frame = pd.read_html(str(tbl))[0]
data_frame.to_csv('hseparser.csv')

我分析它,但数据在A1到A699单元。我需要把数据粉碎到不同的细胞。请帮帮我


Tags: httpsimportruordervalallbudgetrating
1条回答
网友
1楼 · 发布于 2024-09-28 22:44:50

Pandasread_html已经从给定的url读取所有表,并返回表列表。您不必显式地使用BeautifulSoup

>>> url = 'https://ege.hse.ru/rating/2019/81031971/all/?rlist=&ptype=0&vuz-abiturients-budget-order=ge&vuz-abiturients-budget-val=10'
>>> df = pd.read_html(url)
>>> len(df)
2
>>> df[0].head()
                                                   0                                                  1
0                                             Регион  Все  Алтайский край  Амурская область  Арханге...
1                                           Тип вуза  Все  Государственный  Головной  Филиал  Негосу...
2  Вузы с набором  больше  меньше  человек на бюд...  Вузы с набором  больше  меньше  человек на бюд...
>>> df[1].head()
                                                 Вуз  Качество приема на основании среднего балла ЕГЭ зачисленных на бюджетные места 2019  ...  Из них: без экзаменов  Ср.балл рассчитан с вычетом баллов за И.Д.?
0                   Адыгейский гос. ун-т., г. Майкоп                                               60.5                                    ...                      1                                          Нет
1  Азово-Черноморский инженерный ин-т. - филиал Д...                                               45.5                                    ...                      0                                          Нет
2   Академия труда и социальных отношений, г. Москва                                               77.8                                    ...                      0                                           Да
3          Алтайский гос. аграрный ун-т., г. Барнаул                                               54.7                                    ...                      0                                          Нет
4  Алтайский гос. гуманитарно-педагогический ун-т...                                               59.7                                    ...                      0                                           Да

[5 rows x 6 columns]

将此数据帧保存到csv会将所有数据放在不同的单元格中

相关问题 更多 >