使用soup从div获取编码内容

2024-10-01 11:21:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要字符串SKU:E02165 witch以某种方式编码为

SKU: E02165  

从某种意义上说,这是网站上完整的div海峡

^{pr2}$

我试过了

soup = BeautifulSoup(data)
info = soup.find('div' , {'class':'sku'}).contents

以及所有流动的

info = soup.findAll('div', { "class" : "sku"})
info = soup.find('div' , class='sku'}).contents
info = soup.find('div' , "class=" + 'sku'}).contents
info = soup.find('div' , {'class':'sku'}).text
info = soup.find('div' , {'class':'sku'}).contents

如果你能帮我把“sku:”从我认为可以用info=(信息拆分('sku:')[1]),但如果不起作用,请随时告诉我。 谢谢您。在


Tags: 字符串divinfo编码网站方式contentsfind
1条回答
网友
1楼 · 发布于 2024-10-01 11:21:33

试试这个:

>>> div = '<div class="sku">SKU:&nbsp;E02165&nbsp;&nbsp;</div>'
>>> html = BeautifulSoup(div)
>>> div_sku = html.find('div', {'class': 'sku'})
>>> value = div_sku.get_text(strip=True).encode('ascii', 'ignore').split('SKU:')[1]
>>> value
'E02165'

get_text(strip=True)将获取文档或标记的文本部分,并从开始和结尾剥离空白。在

encode('ascii', 'ignore')将忽略文本中的unicode u'\xa0',因此允许split()返回准确的结果。在

或者,您也可以简单地执行以下操作:

^{pr2}$

其中replace(u'\xa0', u'')将用空unicode字符串替换{}。在

相关问题 更多 >