Python中没有id或class属性的beautifulsoup解析表

2024-09-27 17:54:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用beautifulsoup解析下表url中的数据

http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch

因为表没有类属性或id,所以我不能使用汤.找(“table”,{“title”:“TheTitle”})来定位表。相反,我试过

warrantUrl = 'http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch'
warrantPage = urlopen(warrantUrl)
soup = BeautifulSoup(warrantPage, 'html.parser')
table = soup.find_all("tr")
paragraphs = []
for x in table:
    paragraphs.append(str(x))

还有,我试过这篇文章提到的方法, Parse table with BeautifulSoup Python。但是没有成功。。。你知道吗


Tags: comhttphometablelistencgisoup
1条回答
网友
1楼 · 发布于 2024-09-27 17:54:53

这个网站使用javascript,BeautifulSoup不能把它转换成html,它不能处理它,urllib也不能,你需要检查python的Ghost。你知道吗

http://jeanphix.me/Ghost.py/

阅读文档,它非常简单,功能强大,与请求类似。它能够“评估”javascripts并以各种方式返回它们的值。你知道吗

相关问题 更多 >

    热门问题