擅长:python、mysql、java
<p>使用一个HTML解析器,比如那个“漂亮的”透明的<a href="https://beautiful-soup-4.readthedocs.org/en/latest/" rel="nofollow">^{<cd1>}</a>包。在</p>
<p>其思想是使用<code>xxxxxxx</code>,<code>yyyyyy</code>文本来定位<code>td</code>元素,并获得以下<code>td</code>兄弟的文本值(假设<code>xxxxxxx</code>和{<cd4>}是您事先知道的标签):</p>
<pre><code>from bs4 import BeautifulSoup
data = """
<tr>
<td>xxxxxxx</td>
<td style="display: none">e3aa8247-354b-e311-b6eb-005056b42341</td>
<td>yyyyyy</td>
<td style="display: none">e3aa8247-354b-e311-b6eb-005056b42342</td>
<td>zzzz</td>
</tr>
"""
soup = BeautifulSoup(data)
print soup.find("td", text="xxxxxxx").find_next_sibling('td').text
</code></pre>
<p>印刷品:</p>
^{pr2}$