擅长:python、mysql、java
<p>元素的<code>itertext</code>方法返回节点文本数据的迭代器。对于您的<code><a></code>标记,<code>' Detroit'</code>将是迭代器返回的第二个值。若文档的结构始终符合已知的规范,则可以跳过特定的文本元素来获得所需的内容。在</p>
<pre><code>from lxml import html
doc = html.fromstring("""<li><a href="/stations/1"><span class="num">3</span> Detroit</a></li>""")
stop_nodes = doc.cssselect('li a')
stop_names = []
for start in stop_list:
node_text = start.itertext()
node_text.next() # Skip '3'
stop_names.append(node_text.next().lstrip())
continue
</code></pre>
<p>您可以将css选择器与<a href="https://stackoverflow.com/questions/8141956/lxml-classic-get-text-content-except-for-that-of-nested-tags/8142269#8142269">Zachary's answer</a>中提到的xpath <code>text()</code>函数组合在一起(如果您更习惯于使用css选择器而不是xpath):</p>
^{pr2}$