如何从该标记中获取所有文本?

2024-09-28 20:58:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从这个HTML标记中获取所有文本,它存储在变量tag

<td rowspan="2" style="text-align: center;"><a href="/wiki/Glenn_Miller" title="Glenn Miller">Glenn Miller</a> &amp; His Orchestra</td>

结果应该是"Glenn Miller & His Orchestra"。在

但是printingtag.find(text=True)返回这个:"Glenn Miller"。在

如何获取td元素中的其余文本?在


Tags: text标记文本stylehtmltagtdhref
1条回答
网友
1楼 · 发布于 2024-09-28 20:58:48

tag.find(text=True)将返回第一个匹配的文本节点。请改用^{}

>>> from bs4 import BeautifulSoup
>>> data = '<td rowspan="2" style="text-align: center;"><a href="/wiki/Glenn_Miller" title="Glenn Miller">Glenn Miller</a> &amp; His Orchestra</td>'
>>> soup = BeautifulSoup(data, "html.parser")
>>> tag = soup.td
>>> tag.get_text()
'Glenn Miller & His Orchestra'

相关问题 更多 >