使用xPath选择器时无法刮取指向下一页的链接，返回空。（使用胶状物）

2条回答

网友

1楼 · 编辑于 2024-09-28 20:48:56

分页是使用JavaScript生成的，您可以在HTML中看到：

<div class="paginator" id="paginator1"></div>
<div class="paginator_pages">Страниц: 14</div>
<script type="text/javascript">
/*pag1 = new Paginator("id div", vsego stranic, kol-vo na stranice, tekuchay stranica, "url");*/
pag1 = new Paginator("paginator1", 14, 10, 1, "/catalog/s_o_u_l_/page/", "/catalog/s_o_u_l_");
</script>

您可以从<script>块中提取所有相关信息：

import ast

script = response.xpath('//script[contains(text(), "paginator1")]/text()').extract()[0].strip()
paginator = script.splitlines()[1].strip().split('new Paginator')[1].rstrip(';')

paginatorHolderId, pagesTotal, pagesSpan, pageCurrent, baseUrl = ast.literal_eval(paginator)

然后可以根据the pagination script中的逻辑构建分页url（或者只查看url的样子）。你知道吗

网友

2楼 · 编辑于 2024-09-28 20:48:56

如果查看实际的html源代码（response.text），您将看到以下内容：

<div class="paginator" id="paginator1"></div>
<div class="paginator_pages">Страниц: 14</div>
<script type="text/javascript">
/*pag1 = new Paginator("id div", vsego stranic, kol-vo na stranice, tekuchay stranica, "url");*/
pag1 = new Paginator("paginator1", 14, 10, 1, "/catalog/s_o_u_l_/page/", "/catalog/s_o_u_l_");
</script>

如您所见，div确实是空的，并且是通过javascript填充的。你知道吗

有两个选项可以获取这些链接：

自己生成（应该相当容易）
使用一些东西来运行javascript（例如无头浏览器）

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用xPath选择器时无法刮取指向下一页的链接，返回空。（使用胶状物）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >