索引web中的步骤

1条回答

网友

1楼 · 发布于 2024-05-17 03:20:17

您绝对应该使用Scrapy来完成这项web爬网作业。我将给你一个例子，说明如何使用它以及你的web索引应该如何使用。如果有其他问题，请访问网站！在

使用Scrapy提供的XPath表达式，可以提取所需的资源，包括整个文件。在

例如：<h1>Darwin - The Evolution Of An Exhibition</h1>

XPath表达式：//h1/text()

为什么要这样做？使用h1标记，您可以将它变成字典中的键。有了字典，你就可以更容易地访问这些文件。是这样的：

web_index = {
    'Darwin': 'example.html',
    'Evolution': 'example.html'
}

最好将web索引放在字典中，因为它是一个键-值对，您可以从中轻松地“搜索”，而不像在依赖索引的列表中那样。在