如何在python中使用scrapy从span中获取文本?

2024-09-29 23:31:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我在这里放置HTML代码:

<div class="rendering rendering_person rendering_short rendering_person_short">
  <h3 class="title">
    <a rel="Person" href="https://moh-it.pure.elsevier.com/en/persons/massimo-eraldo-abate" class="link person"><span>Massimo Eraldo Abate</span></a>
  </h3>
  <ul class="relations email">
    <li class="email"><a href="massimo.abate@ior.it" class="link"><span>massimo.abate@ior.it</span></a></li>
  </ul>
  <p class="type"><span class="family">Person: </span>Academic</p>
</div>

从上面的代码如何提取Massimo Eraldo Abate?在

请帮帮我。在


Tags: 代码divlinkith3classpersonshort
2条回答

请看一下这一页。有很多提取文本的方法 scrapy docs

>>> body = '<html><body><span>good</span></body></html>'
>>> Selector(text=body).xpath('//span/text()').extract()

>>> response = HtmlResponse(url='http://example.com', body=body)
>>> Selector(response=response).xpath('//span/text()').extract()

您可以使用

response.xpath('//h3[@class="title"]/a/span/text()').extract_first()

另外,请查看这个Scrapinghub的blogpost,了解XPath的介绍。在

相关问题 更多 >

    热门问题