在scrapy中逐个选择结果

2条回答

网友

1楼 · 编辑于 2024-10-16 22:35:31

试试看。你需要稍微修改一下我的脚本以适合你的项目。你可以解决上面提到的问题。在

import requests
from scrapy import Selector

res = requests.get("https://www.indeed.cl/trabajo?q=Data%20scientist")
sel = Selector(res)
for item in sel.css("h2.jobtitle a"):
    title = ' '.join(item.css("::text").extract())
    print(title)

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-10-16 22:35:31

首先，我只得到a（没有text()和extract()），然后我将使用for将text()和{}与everya分开使用，而join()将元素连接到带标题的字符串中。在

import scrapy

class MySpider(scrapy.Spider):

    name = 'myspider'

    start_urls = ['https://www.indeed.cl/trabajo?q=Data%20scientist&l=']

    def parse(self, response):
        print('url:', response.url)

        results = response.xpath('//h2[@class="jobtitle"]/a')
        print('number:', len(results))

        for item in results:
            title = ''.join(item.xpath('.//text()').extract())
            print('title:', title)

#  - it runs without project and saves in `output.csv`  -

from scrapy.crawler import CrawlerProcess

c = CrawlerProcess({
    'USER_AGENT': 'Mozilla/5.0',
})
c.crawl(MySpider)
c.start()

结果：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

在scrapy中逐个选择结果

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >