Python+Scrapy+JSON+XPath：如何使用Scrapy获取JSON数据

def parse(self, response): events = response.xpath('**What To Write Here?**').extract() for event in events: absolute_url = response.urljoin(event) yield Request(absolute_url, callback = self.parse_event)

2条回答

网友

1楼 · 编辑于 2024-09-28 03:13:29

What to write here?

events = response.xpath("//script[@type='application/ld+json']").extract()
events = json.loads(events[0])

网友

2楼 · 编辑于 2024-09-28 03:13:29

查看url的页面源代码，然后复制第76-9045行并另存为数据.json在本地驱动器中，然后使用此代码。。。在

import json
from bs4 import BeautifulSoup
import requests
req = requests.get('https://highape.com/bangalore/all-events')
soup = BeautifulSoup(req.content, 'html.parser')
js = soup.find_all('script')[5].text
data = json.loads(js, strict=False)
for i in data:
    url = i['url']
    print(url)
    ##callback with scrapy

编程相关推荐

mysql如何正确安装MySQLConnector java？
java如何通过发送列表从数据库获取数据？
java将结束标记添加到HtmleElement（HtmlUnit）
java将多个高亮灯设置为一个窗格
java中比较器的使用
java如何访问servlet和下载附件？
未调用swing java绘制方法
Hibernate中映射实体的java问题
无法创建java SessionFactory和接口实现bean
java Hibernate从JTA转变为每个线程的延迟加载和会话

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python+Scrapy+JSON+XPath：如何使用Scrapy获取JSON数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >