import scrapy
class WanikaniSpider(scrapy.Spider):
name = 'japandict'
allowed_domains = ['www.japandict.com']
start_urls = ['https://www.japandict.com/lists/jlpt5k']
def parse(self, response):
kanjiler = response.xpath("//div[@class='row']/div/div/div")
for kanji in kanjiler:
kanjiicon= kanji.xpath("//div[@class='row']/div/div/div/a/div/span")
yield{
'kanjiicon': kanjiicon
}
我就这样创造了蜘蛛。我想把kanjiicon
作为文本。但是当我使用.get
.extract
方法时,其返回值为空。
我怎样才能解决这个问题
我得到了输出
代码:
输出:
您需要将字符串解码为utf-8,ascii不包含日文字符
尝试以下方法:
相关问题 更多 >
编程相关推荐