如何使用Scrapy获取Html OnClick参数

2024-09-24 02:16:59 发布

男 | 程序猿一只，喜欢编程写python代码。

我想从linkhttp://www.yad2.co.il/Nadlan/sales.php?City=%E1%F0%E9%EE%E9%F0%E4+%E2%$

我用Firebug检查了要提取的html代码，NadlanId值在： <td onclick="show_ad('2','1','/Nadlan/salesDetails.php','NadlanID','1614569','644');"> בית אריה - יאיר שטרן </td>

我用下面的代码来检查scray是否解析了上面的html代码：

import scrapy

class QuotesSpider(scrapy.Spider):
    name = "quotes"
    start_urls = [
    'http://www.yad2.co.il/Nadlan/sales.php?City=%E1%F0%E9%EE%E9%F0%E4+%E2%$
]

def parse(self, response):
    page = response.url.split("/")[-2]
    filename = 'quotes-%s.html' % page
    with open(filename, 'wb') as f:
        f.write(response.body)`

但是没有NadlanId响应.正文. 在

如何获取NadlanId值？在

Tags：代码 city response html www il td scrapy

1条回答

网友

1楼 · 发布于 2024-09-24 02:16:59

在本例中，您希望从htmlonclick属性检索javascript函数参数。在

首先我们找到了整个onclick文本：

text = response.xpath("//td/@onclick").extract_first()

然后可以使用简单的正则表达式模式来查找函数参数：

^{pr2}$

如何使用Scrapy获取Html OnClick参数

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用Scrapy获取Html OnClick参数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >