2024-09-25 06:33:35 发布
网友
各位:
我是新来的靓汤,在解析表上工作,我能够达到细胞级。假设细胞是我想提取的东西。。。在
我知道类型(细胞)是 我知道手机内容是
<td> Raptors v. Jazz <b>UNDER 196</b> </td>
当我这么做的时候单元格.text,我明白了
输出: 猛龙队诉爵士乐196岁以下
但我真正想要的是
预期输出: 猛龙队诉爵士乐196岁以下 因为里面的物品是获胜的队伍。。。。在
我该怎么做?在
提前谢谢
您正在寻找decode_contents:
decode_contents
>>> td.decode_contents() ' Raptors v. Jazz <b>UNDER 196</b> '
让我们在extract()上耍些小把戏
extract()
PageElement.extract() removes a tag or string from the tree.
示例:
<html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b>The Dormouse's <i>story</i></b></p> ....
如果您只需在目标标记上使用extract(),您将得到
但是如果提取标记上的.next元素,则得到
.next
>> soup.find('p', {"class": "title"}).next.extract() <b>The Dormouse's <i>story</i></b>
您正在寻找
decode_contents
:让我们在
extract()
上耍些小把戏示例:
如果您只需在目标标记上使用
^{pr2}$extract()
,您将得到但是如果提取标记上的
.next
元素,则得到相关问题 更多 >
编程相关推荐