我一直试图用table id=“tblDataset2”解析表here,并试图访问表中的行,但当我使用beauthoulGroup解析网页时,只得到一行。 我的代码是:
from bs4 import BeautifulSoup
import requests
URL = 'http://podaac.jpl.nasa.gov/ws/'
dataset_ids = []
html = requests.get(URL + 'search/granule/index.html')
soup = BeautifulSoup(html.text, 'html.parser')
table = soup.find("table", {"id": "tblDataset2"})
rows = table.find_all('tr')
rows.remove(rows[0])
print table
for row in rows:
x = row.find_all('td')
dataset_ids.append(x[0].text.encode('utf-8'))
print dataset_ids
我想访问表的所有行。请帮我拿这个。谢谢。在
这个特定的数据集是由浏览器从另一个返回JSON响应的端点异步加载的。直接向该端点发出请求:
印刷品:
^{pr2}$对于第一个数据集,您需要向“search”端点发出GET请求:
印刷品:
如果不想深入研究页面的加载和格式,可以使用由^{} 自动生成的真正的浏览器。在
相关问题 更多 >
编程相关推荐