我有兴趣从http://hdsc.nws.noaa.gov/hdsc/pfds/pfds_map_cont.html?Lat=33.146425&Lon=-87.5805543中从以下源代码中获取“0.449”。在
<td class="tblInner" id="0-0">
<div style="font-size:110%">
<b>0.449</b>
</div>
"(0.364-0.545)"
</td>
使用BeautifulSoup,我现在写了:
^{pr2}$结果是:
<td class="tblInner" id="0-0">-</td>
我不确定为什么td中嵌套的所有内容都没有出现。当我搜索td的内容时,我的结果只是“-”。如何从代码中获取我想要的值?在
请原谅缺乏错误检查和模块化,但根据@Eloims的观察,这应该能满足您的需要:
您可能会抓取一个在初始加载后使用javascript更新DOM的网站。在
你有几个选择:
python headless browser
)。在编辑:
我没看到你发布了你想删除的网址。在
在您的特定情况下,您需要的数据来自对以下URL的AJAX调用:
http://hdsc.nws.noaa.gov/cgi-bin/hdsc/new/cgi_readH5.py?lat=33.1464&lon=-87.5806&type=pf&data=depth&units=english&series=pds
现在只需要了解每个参数的作用,并解析其输出,而不必编写HTML scraper。在
相关问题 更多 >
编程相关推荐