使用soup从div获取编码内容

info = soup.findAll('div', { "class" : "sku"}) info = soup.find('div' , class='sku'}).contents info = soup.find('div' , "class=" + 'sku'}).contents info = soup.find('div' , {'class':'sku'}).text info = soup.find('div' , {'class':'sku'}).contents

1条回答

网友

1楼 · 发布于 2024-10-01 11:21:33

试试这个：

>>> div = '<div class="sku">SKU:&nbsp;E02165&nbsp;&nbsp;</div>'
>>> html = BeautifulSoup(div)
>>> div_sku = html.find('div', {'class': 'sku'})
>>> value = div_sku.get_text(strip=True).encode('ascii', 'ignore').split('SKU:')[1]
>>> value
'E02165'

get_text(strip=True)将获取文档或标记的文本部分，并从开始和结尾剥离空白。在

encode('ascii', 'ignore')将忽略文本中的unicode u'\xa0'，因此允许split()返回准确的结果。在

或者，您也可以简单地执行以下操作：

^{pr2}$

其中replace(u'\xa0', u'')将用空unicode字符串替换{}。在

编程相关推荐

Java捕获对象错误
添加到HashMap时出现java NullPointerException
java布尔返回问题/从放入数组的方法中获取因子
循环的java打印模式
如何使用azure Java存储SDK V10获取blob Uri
java My app正在将Db实体序列化到de-webservice层。如何将所有内容都转换为DTO？
java通过视频帧平滑地移动水平视图
通过Java中的JFormattedTextFields进行swing验证
java使用Gson将JSON反序列化为非静态嵌套类
java我应该故意捕获检查过的异常吗？

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用soup从div获取编码内容

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >