我正在用以下格式的BeautifulGroup刮一页
<tr class="bgWhite">
<td align="center" width="50"><nobr>A</nobr></td>
<td align="center"> 0</td>
<td align="left" width="*"> 1</td>
<td align="center"> 2</td>
<td align="center"> 3</td>
<td align="center"> 4</td>
<td align="center"><nobr> 23-Apr-13 </nobr></td>
</tr>
当我调用col[5].string
或以这种方式调用1-5之间的任何索引时,它工作得很好。但是nobr标记似乎引起了一个问题,当我尝试do col[6].string
时,它似乎没有返回任何值
我用
^{pr2}$你知道怎么得到这些数据吗?
根据BeautifulSoup的版本,您有两个选项:
beautifulGroup 4,使用
.stripped_strings
属性查找所有非空的文本元素:在BeautifulGroup 3中,您需要搜索所有包含的文本:
^{pr2}$相关问题 更多 >
编程相关推荐