来自WeatherAPI的Python Webscraping表元素

2024-09-28 16:54:39 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我尝试使用国家气象服务API从表中获取单个元素。具体来说,我正在努力了解我居住的地方的当前天气。整个网页只是一个巨大的表格,除了打印所有漂亮的汤抓取的东西外,我还没有找到获取信息的方法。我如何获取时段0的短期预测信息(如果您访问该网站),或者如何开始基本设置?任何帮助都将不胜感激(也为额外的导入感到抱歉,我已经尝试了很多不同的方法)

import requests
from bs4 import BeautifulSoup
import lxml.html as lh
import pandas as pd
from html_table_parser import HTMLTableParser as pars
from pprint import pprint

URL = 'https://api.weather.gov/gridpoints/ILN/22,23/forecast/hourly'

def url_content(url): 
    req = urllib.request.Request(url=url) 
    f = urllib.request.urlopen(req)
    return f.read()

def main():
    xhtml = url_content(url).decode('utf-8')
    p = pars() 
    p.feed(xhtml) 
    pprint(p.tables[0]) 

if __name__ == "__main__":
    main()

如果有帮助的话,这就是错误,目标是main方法中的“pprint(p.tables[0])

IndexError: list index out of range


Tags: 方法fromimporturlmainrequestdefhtml