这是我试图从中提取文本的HTML代码
<fieldset>
<div class="grid-3-12 form-no-lbl">
<label class="form-lbl">CNPJ:</label>011234560083
</div>
<div class="grid-3-12 form-no-lbl">
<label class="form-lbl">CIDADE:</label>TAUBATE
</div>
<div class="grid-3-12 form-no-lbl">
<label class="form-lbl">ESTADO:</label>SP
</div>
<div class="grid-3-12 form-no-lbl">
<label class="form-lbl">TOTAL BRUTO: </label>2.407,09
</div>
<div class="grid-3-12 form-no-lbl">
<label class="form-lbl">LIQ: </label>2.344,09
</div>
</fieldset>
这个代码
^{pr2}$只返回第一个元素:011234560083
我想读取每个标签的值,比如“LIQ:”=2.344,09
这是硒中一个相当普遍的问题。只是因为不能用
find_element_by_*
命令直接匹配文本节点。在您的例子中,我假设您事先知道
LIQ
、ESTADO
等标签,并且需要通过该标签获得一个值。在其思想是通过文本定位
label
,在树上移动到父级,获取文本,按:
拆分,并得到与所需值相对应的最后一个元素:如果您可以同时使用},那么可以使用
selenium
和{selenium
导航到所需的页面,然后使用lxml
来解析HTML。例如收益率
^{pr2}$你的代码不工作似乎真的很奇怪。我还没碰到过这样的案子。我认为下面的代码应该有效。基本上,我获取
LABEL
中的文本,并将其添加到您已经找到的文本中。这个组合应该可以得到你要找的文本。在相关问题 更多 >
编程相关推荐