我很难从我用scrapy抓取的数据中删除不需要的字符。在
示例数据:
'Premium Terraced Studio', '51 weeks (09/09/2017 - 31/08/2018) Room - Lease', '', '', '', '', '', '', 'Premium Plus Terraced Studio', '51 weeks (09/09/2017 - 31/08/2018) Room - Lease', '',
'', '', '',
它更乱,而且有新的线条,但我用了这个,这样就把它清理干净了:
[s.strip() for s in response.xpath('//div/div/table/tbody/tr/td/div/text()').extract()]
我也试过这个,但没什么用:
^{pr2}$任何想法都是徒劳的!在
您可以将
filter
与None
一起使用,即:更新:
我通常使用
^{pr2}$lxml
来解析html
,下面是一个可以帮助您的示例:输出:
相关问题 更多 >
编程相关推荐