Python中没有id或class属性的beautifulsoup解析表

2024-09-27 17:54:53 发布

您现在位置：Python中文网/ 问答频道 /正文

4772

网友

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试使用beautifulsoup解析下表url中的数据

http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch

因为表没有类属性或id，所以我不能使用汤.找（“table”，{“title”：“TheTitle”}）来定位表。相反，我试过

warrantUrl = 'http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch'
warrantPage = urlopen(warrantUrl)
soup = BeautifulSoup(warrantPage, 'html.parser')
table = soup.find_all("tr")
paragraphs = []
for x in table:
    paragraphs.append(str(x))

还有，我试过这篇文章提到的方法， Parse table with BeautifulSoup Python。但是没有成功。。。你知道吗

Tags： com http home table list en cgi soup

1条回答

网友

1楼 · 发布于 2024-09-27 17:54:53

这个网站使用javascript，BeautifulSoup不能把它转换成html，它不能处理它，urllib也不能，你需要检查python的Ghost。你知道吗

http://jeanphix.me/Ghost.py/

阅读文档，它非常简单，功能强大，与请求类似。它能够“评估”javascripts并以各种方式返回它们的值。你知道吗

Python中没有id或class属性的beautifulsoup解析表

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python中没有id或class属性的beautifulsoup解析表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >