我想从linkhttp://www.yad2.co.il/Nadlan/sales.php?City=%E1%F0%E9%EE%E9%F0%E4+%E2%$
我用Firebug检查了要提取的html代码,NadlanId值在:
<td onclick="show_ad('2','1','/Nadlan/salesDetails.php','NadlanID','1614569','644');"> בית אריה - יאיר שטרן </td>
我用下面的代码来检查scray是否解析了上面的html代码:
import scrapy
class QuotesSpider(scrapy.Spider):
name = "quotes"
start_urls = [
'http://www.yad2.co.il/Nadlan/sales.php?City=%E1%F0%E9%EE%E9%F0%E4+%E2%$
]
def parse(self, response):
page = response.url.split("/")[-2]
filename = 'quotes-%s.html' % page
with open(filename, 'wb') as f:
f.write(response.body)`
但是没有NadlanId响应.正文. 在
如何获取NadlanId值?在
在本例中,您希望从html
onclick
属性检索javascript函数参数。在首先我们找到了整个onclick文本:
然后可以使用简单的正则表达式模式来查找函数参数:
^{pr2}$相关问题 更多 >
编程相关推荐