我在scrapy中写了一个非常基本的spider,从stackoverflow的登陆页面上抓取问题的标题。在过去的几个小时里,我一直在努力让它正常工作,但每次执行脚本时都会遇到相同的错误。完整的回溯如下所示。在
items.py
包括:
import scrapy
class StackoverflowspiderItem(scrapy.Item):
name = scrapy.Field()
infograbber.py
aka spider包含:
这是Project Hierarchy
:
我的错误是:
Traceback (most recent call last):
File "C:\Users\WCS\Desktop\stackoverflowspider\stackoverflowspider\spiders\infograbber.py", line 4, in <module>
from stackoverflowspider.items import StackoverflowspiderItem
ModuleNotFoundError: No module named 'stackoverflowspider'
仅供参考:当我尝试下面的方法时,它会起作用,但我不想这样。在
import scrapy
from scrapy.crawler import CrawlerProcess
class InfograbberSpider(scrapy.Spider):
name = 'infograbber'
allowed_domains = ['stackoverflow.com']
start_urls = ['https://stackoverflow.com/questions/']
def parse(self, response):
for question in response.css(".question-hyperlink"):
print(question.css("::text").extract_first())
c = CrawlerProcess({
'USER_AGENT': 'Mozilla/5.0',
})
c.crawl(InfograbberSpider)
c.start()
我哪里出错了?提前感谢您的任何解决方案。顺便说一句,我用的是python 3.6
和{cmd
和sublime text editor
来执行该文件,但在这两种情况下,我都得到了相同的错误。在
我认为您的问题是执行
spider
如下所示:但是你需要进入你的文件夹
^{pr2}$scrapy.cfg
,然后像这样运行scrapy:相关问题 更多 >
编程相关推荐