美丽组看不到nobr标签

2024-09-29 22:01:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在用以下格式的BeautifulGroup刮一页

<tr class="bgWhite">
<td align="center" width="50"><nobr>A</nobr></td>
<td align="center"> 0</td>
<td align="left" width="*"> 1</td>
<td align="center"> 2</td>
<td align="center"> 3</td>
<td align="center"> 4</td>
<td align="center"><nobr> 23-Apr-13 </nobr></td>
</tr>

当我调用col[5].string或以这种方式调用1-5之间的任何索引时,它工作得很好。但是nobr标记似乎引起了一个问题,当我尝试do col[6].string时,它似乎没有返回任何值

我用

^{pr2}$

你知道怎么得到这些数据吗?


Tags: string格式方式colwidthlefttrapr
1条回答
网友
1楼 · 发布于 2024-09-29 22:01:10

根据BeautifulSoup的版本,您有两个选项:

beautifulGroup 4,使用.stripped_strings属性查找所有非空的文本元素:

print ' '.join(col[6].stripped_strings)

在BeautifulGroup 3中,您需要搜索所有包含的文本:

^{pr2}$

相关问题 更多 >

    热门问题