如何在python中使用scrapy从span中获取文本？

<div class="rendering rendering_person rendering_short rendering_person_short"> <h3 class="title"> <a rel="Person" href="https://moh-it.pure.elsevier.com/en/persons/massimo-eraldo-abate" class="link person"><span>Massimo Eraldo Abate</span></a> </h3> <ul class="relations email"> <li class="email"><a href="massimo.abate@ior.it" class="link"><span>massimo.abate@ior.it</span></a></li> </ul> <p class="type"><span class="family">Person: </span>Academic</p> </div>

2条回答

网友

1楼 · 编辑于 2024-09-29 23:31:59

请看一下这一页。有很多提取文本的方法 scrapy docs

>>> body = '<html><body><span>good</span></body></html>'
>>> Selector(text=body).xpath('//span/text()').extract()

>>> response = HtmlResponse(url='http://example.com', body=body)
>>> Selector(response=response).xpath('//span/text()').extract()

网友

2楼 · 编辑于 2024-09-29 23:31:59

您可以使用

response.xpath('//h3[@class="title"]/a/span/text()').extract_first()

另外，请查看这个Scrapinghub的blogpost，了解XPath的介绍。在

相关问题更多 >

编程相关推荐

热门问题

热门文章