使用显示空表的请求进行web抓取?

2024-09-27 21:26:36 发布

您现在位置:Python中文网/ 问答频道 /正文

from lxml import html
import requests
page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.xpath('//table/text()')
print(tables)

在这里,我想从上面的url获取所有表。 但是如果有很多桌子的话,这个列表就空了 在网页中


Tags: fromimportcomtreehttptablesgethtml
1条回答
网友
1楼 · 发布于 2024-09-27 21:26:36

这是我创建和测试的示例代码,它将表格打印到一个html文件中,您可以在浏览器中打开该文件

from lxml import html
from lxml import etree
import requests

page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.cssselect('table')

file = open("output.html","wb") 

for table in tables:
    file.write(etree.tostring(table))

相关问题 更多 >

    热门问题