但保持汤的形状

2024-09-25 06:33:35 发布

您现在位置:Python中文网/ 问答频道 /正文

各位:

我是新来的靓汤,在解析表上工作,我能够达到细胞级。假设细胞是我想提取的东西。。。在

我知道类型(细胞)是 我知道手机内容是

<td> Raptors v. Jazz <b>UNDER 196</b> </td>

当我这么做的时候单元格.text,我明白了

输出: 猛龙队诉爵士乐196岁以下

但我真正想要的是

预期输出: 猛龙队诉爵士乐196岁以下 因为里面的物品是获胜的队伍。。。。在

我该怎么做?在

提前谢谢


Tags: text类型内容物品td细胞手机under
2条回答

您正在寻找decode_contents

>>> td.decode_contents()
' Raptors v. Jazz <b>UNDER 196</b> '

让我们在extract()上耍些小把戏

PageElement.extract() removes a tag or string from the tree.

示例:

<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's <i>story</i></b></p>
....

如果您只需在目标标记上使用extract(),您将得到

^{pr2}$

但是如果提取标记上的.next元素,则得到

>> soup.find('p', {"class": "title"}).next.extract()
<b>The Dormouse's <i>story</i></b>

相关问题 更多 >