擅长:python、mysql、java
<p>首先,<code>soup.find_all()</code>返回一个<code>ResultSet</code>,它包含标记为<code>td</code>和字符串为<code>Title:</code>的所有元素。在</p>
<p>对于结果集中的每个这样的元素,您将需要分别获得nextSibling(另外,您应该循环直到找到标记<code>td</code>的nextSibling,因为您可以在这两者之间获得其他元素(比如NavigableString))。在</p>
<p>示例-</p>
<pre><code>>>> from bs4 import BeautifulSoup
>>> s="""<tr>
... <td>Title:</td>
... <td>Title value</td>
... </tr>"""
>>> soup = BeautifulSoup(s,'html.parser')
>>> row = soup.find_all('td', string='Title:')
>>> for r in row:
... nextSib = r.nextSibling
... while nextSib.name != 'td' and nextSib is not None:
... nextSib = nextSib.nextSibling
... print(nextSib.text)
...
Title value
</code></pre>
<hr/>
<p>或者您可以使用另一个支持XPATH的库,使用XPATH可以很容易地做到这一点。其他库如-<code>lxml</code>或<code>xml.etree</code>。在</p>