尝试使用python抓取此网站，但无法获得所需的d

2条回答

网友

1楼 · 编辑于 2024-07-04 08:21:16

数据可以直接作为JSON提供。您可以使用请求来获得：

import requests

r = requests.post('https://siftery.com/product-json/microsoft-outlook')
data = r.json()['content']
companies = data['companies']
for company in companies:
    print(companies[company]['name'])

输出

^{pr2}$

您可能需要调查其他类别的信息：

>>> data.keys()
[u'product', u'vendor', u'users', u'group_members', u'companies', u'customers', u'other_categories', u'current_user', u'page_info', u'portfolio_products', u'primary_category', u'metadata']

网友

2楼 · 编辑于 2024-07-04 08:21:16

该站点使用javascript加载信息，这意味着当您执行请求时，DOM将不带信息呈现，因为它是异步加载的，对于像这样的站点，您应该使用selenium。在

注：在构建scraper之前，您应该查看站点是否有一个api或端点，并禁用CORS，在这种情况下，您可以通过post请求来获取信息https://siftery.com/product-json/<product_name>

相关问题更多 >

编程相关推荐

热门问题

热门文章

尝试使用python抓取此网站，但无法获得所需的d

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >