此页包含我要与BeautifulSoup一起废弃的表:
Flavors of Cacao - Chocolate Database
这个表位于一个id为div
的spryregion1
的div
中,但是它不能用id来定位,因此我用表的宽度来定位它,然后定位所有的tr
元素。你知道吗
![printing all 'tr' elements](https://i.stack.imgur.com/emVqI.png)
列标题包含在th
元素中,每一行条目都包含在td
中。我尝试了几种方法,但无法将所有行刮到CSV文件中。你知道吗
有人能给我一些帮助/建议吗?谢谢!你知道吗
An article I found on creating Spry Regions
Tags:
您要查找的表不包含在所请求页面的HTML中。该页面使用Javascript请求另一个包含它的HTML文档,然后使用您要查找的
<div>
包装该文档。你知道吗要获取该表,可以使用浏览器工具发现页面请求的URL,并使用此工具获取所需的页面:
在那里,您可以首先通过搜索
<th>
条目来提取标题行,然后迭代所有行。可以使用Python的CSV库将数据写入CSV文件。你知道吗给你一个
output.csv
文件开始:使用Python3.6.3测试
相关问题 更多 >
编程相关推荐