Scrapy和Xpath从javascript代码中提取数据

2024-10-01 17:40:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在学习的过程中,同时使用scrapy构建了一个网络蜘蛛。我需要帮助从以下javascript代码中提取一些信息:

<script language="JavaScript" type="text/javascript+gk-onload">

    SKART = (SKART) ? SKART : {};
    SKART.analytics = SKART.analytics || {};
    SKART.analytics["category"] = "television";
    SKART.analytics["vertical"] = "television";
    SKART.analytics["supercategory"] = "homeentertainmentlarge";
    SKART.analytics["subcategory"] = "television";

</script>

我希望使用Xpath提取作为电视的类别信息。请帮我拿我应该用的选择器。在


Tags: 代码text网络信息过程typescriptjavascript
1条回答
网友
1楼 · 发布于 2024-10-01 17:40:56

您可以使用Selector对正则表达式的内置支持^{}

pattern = r'SKART\.analytics\["category"\] = "(\w+)";'
response.xpath('//script[@type="text/javascript+gk-onload"]').re(pattern)

演示(使用^{}):

^{pr2}$

相关问题 更多 >

    热门问题