我正在尝试从web上搜索给定线路的公交站点名称,下面是212https://www.m2.rozkladzik.pl/warszawa/rozklad_jazdy.html?l=212线路的示例页面。我想有两个列表作为输出,一个在一个方向上有公交站点名称,另一个在另一个方向上有公交站点名称。(在网页上可以清楚地看到)。我设法把所有的名字都列在一张名单上
import requests
from bs4 import BeautifulSoup
def download_bus_schedule(bus_number):
URL = "http://www.m2.rozkladzik.pl/warszawa/rozklad_jazdy.html?l=" + bus_number
r = requests.get(URL)
soup = BeautifulSoup(r.content,
'html5lib')
print(soup.prettify())
all_bus_stops = []
table = soup.find_all('a')
for element in table:
if element.get_text() in all_bus_stops:
continue
else:
all_bus_stops.append(element.get_text())
return all_bus_stops
print(download_bus_schedule('212'))
我想解决办法是把汤分成两份
您可以使用
bs4.element.Tag.findAll
方法:输出:
我可能误解了,因为我不懂波兰语,但看看这是否有帮助
相关问题 更多 >
编程相关推荐