根据漂亮汤中儿童的文本值查找标签列表

<tbody> <tr class="" data-row="0"> <tr class="" data-row="1"> <tr class="" data-row="2"> <td align="right" csk="13">13</td> <td align="left" csk="Jones,Andre"><a href="/players/andre-jones-2.html">Andre Jones</a> </td> <tr class="" data-row="3"> <td align="right" csk="7">7</td> <td align="left" csk="Jones,DeAndre"><a href="/players/deandre-jones-1.html">DeAndre Jones</a> </td> <tr class="" data-row="4"> <tr class="" data-row="5">

2条回答

网友

1楼 · 编辑于 2024-10-01 13:24:15

无论你想要什么。：）

解决方案1

逻辑：找到第一个标记，其标记名为tr，并在该标记的文本中包含“FooName”，包括其子标记。在

# Exact Match  (text is unicode, turn into str)
print Table.find(lambda tag: tag.name=='tr' and 'FooName' == tag.text.encode('utf-8'))
# Fuzzy Match
# print Table.find(lambda tag: tag.name=='tr' and 'FooName' in tag.text)

输出：

^{pr2}$

解决方案2

逻辑：找到其文本包含FooName的元素，在本例中是anchor标记。然后在树上搜索标记名为tr的所有父代（包括祖先）

# Exact Match
print Table.find(text='FooName').find_parent('tr')
# Fuzzy Match
# import re
# print Table.find(text=re.compile('FooName')).find_parent('tr')

输出

^{pr2}$

网友

2楼 · 编辑于 2024-10-01 13:24:15

使用XPath和lxml可以很容易地做到这一点：

import lxml.html

root = lxml.html.fromstring('''...''')
td = root.xpath('//tr[.//a[text() = "FooName"]]')

美丽组“等价物”应该是：

^{pr2}$

或者如果你回头想想：

td = soup.find('a', text='FooName').find_parent('tr')

相关问题更多 >

编程相关推荐

热门问题

热门文章