使用scrapy从HTML表中提取数据：响应.xpath（）产生非

1条回答

网友

1楼 · 发布于 2024-05-11 22:44:54

import scrapy


class ResidentialRecordsSpider(scrapy.Spider):
    name = "residential_records"

    start_urls = [
        'http://land.elpasoco.com/ResidentialBuilding.aspx?schd=5317443025&bldg=1',
    ]

    def parse(self, response):
        for record in response.xpath('//table[@width="90%"]//td'):
            key = record.xpath('./strong/text()').extract_first(default='')
            value = record.xpath('./text()').extract_first(default='')

            yield { key: value }

这里只需要执行一些数据清理

编程相关推荐

java如何在删除后修复recyclerView中的项目重复？
java如何在Android中使用Handle而不增加内存
java（i>>>距离）是如何工作的
java如何在菜单项操作之后删除JTabbedPane的内容
springintermediatejavax。ejb。EJBException:java。Jboss应用程序中的lang.NullPointerException
Java：派生类中的方法链接
java InputListener不适用于正交摄影机和角色
java不能写这个方法吗？
java为什么Apache Kafka消费者不使用来自主题的消息？
使用scanner Java从文本文件填充二维数组

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用scrapy从HTML表中提取数据：响应.xpath（）产生非

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >