擅长:python、mysql、java
<p>试试这个:</p>
<pre><code>for row in response.css('#chromatography table tr:not(.header)'):
yield {'titulo': row.xpath('./preceding-sibling::tr/th[contains(@class, "outer")]//a/text()').extract_first().strip(),
'clase': row.xpath('./preceding-sibling::tr/th[contains(@class, "inner")]//text()').extract_first().strip(),
'subclase': row.xpath('./td[2]//text()').extract_first().strip(),
'contenido': row.css('.content_value a::text').extract_first().strip()}
</code></pre>
<p>请记住,内部循环选择器也应该是相对于节点<code>flv</code>的,使用<code>//</code>进行选择是一个全局选择器,因此它将获取所有内容。
最好检查真实的html代码,因为浏览器可能会呈现与实际接收到的html不同的其他代码(例如<code>tbody</code>标记)</p>