import requests
from bs4 import BeautifulSoup
import pandas as pd
url = "https://ntr.tourism.government.bg/CategoryzationAll.nsf/mn.xsp"
page = requests.get(url)
soup = BeautifulSoup(page.text,'lxml')
print(soup)
data = []
table = soup.find('table', {'class':'table table-striped table-hover mnastaniavane dataTable no-footer'})
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele])
这是一个网页:https://ntr.tourism.government.bg/CategoryzationAll.nsf/mn.xsp我想为一个大学项目在一个特定的地点拍摄所有酒店的照片(例如,瓦尔纳-该地点在西里尔语)。我找到了源代码并描述了确切的表-但我无法从表中刮取任何行/元素等。 有什么推荐吗!? 虽然目前有很多信息,但我没有找到一个有用的代码来整理表格
您可以使用selenium(python库)从动态生成数据的网页中获取数据,您可以从here下载chrome drive
数据来自Ajax请求,因此您只需执行Ajax请求,而无需呈现页面,这会更快
例如,这是页面20行中的前4列:
输出:
相关问题 更多 >
编程相关推荐