无法从父节点和子节点/标记中获取文本问题的回答

无法从父节点和子节点/标记中获取文本

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

在标记为重复之前，我搜索并尝试了SO上找到的其他解决方案，这些解决方案包括： <ol> <li><a href="https://stackoverflow.com/questions/40985060/scrapy-css-selector-get-text-of-all-inner-tags/40985082">scrapy css selector: get text of all inner tags</a></li> <li><a href="https://stackoverflow.com/questions/26631196/how-to-get-the-text-from-child-nodes-if-it-is-parents-to-other-node-in-scrapy-us">How to get the text from child nodes if it is parents to other node in Scrapy using XPath</a></li> <li><a href="https://stackoverflow.com/questions/26564843/scrapy-get-the-entire-text-including-children">scrapy get the entire text including children</a></li> </ol> 我要提取的HTML是： <pre><code> Mandarin Oriental Hotel <a class="" href="/search-results/Jalan+Pinang%252C+Kuala+Lumpur+City+Centre%252C+50088+Kuala+Lumpur%252C+Wilayah+Persekutuan./?state=Kuala+Lumpur" itemprop="addressRegion" title="Jalan Pinang, Kuala Lumpur City Centre, 50088 Kuala Lumpur, Wilayah Persekutuan."> Jalan Pinang, Kuala Lumpur City Centre, 50088 Kuala Lumpur, Wilayah Persekutuan. </a> , <a class="" href="/search-results/?neighbourhood=Kuala+Lumpur&state=Kuala+Lumpur" title="Kuala Lumpur"> Kuala Lumpur </a> , <a class="" href="/search-results/?state=Kuala+Lumpur" title="Kuala Lumpur"> Kuala Lumpur </a> 50088 </code></pre> 我想获取//span[@class='location']中的所有文本。在 我试过： <ol> <li><code>response.xpath("//span[@class='location']//text()").extract_first()</code></li> <li><code>response.css("span.location *::text").extract_first()</code></li> <li><code>response.css("span.location ::text").extract_first()</code></li> </ol> 它们都只返回<code>Mandarin Oriental Hotel</code>，而不是完整地址。在 编辑：文本应该屈服 <blockquote> Mandarin Oriental Hotel Jalan Pinang, Kuala Lumpur City Centre, 50088 Kuala Lumpur, Wilayah Persekutuan., Kuala Lumpur, Kuala Lumpur 50088 </blockquote>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

无法从父节点和子节点/标记中获取文本

1 个回答

相关Python问题