如何使用python获取<li>和标记中的每个值 - 问答

<ul class="twin-set-list"> <li>Vintage 2000</li> <li>Type Red</li> <li>Producer Balnaves of Coonawarra</li> <li>Varietal Cabernet Sauvignon</li> <li>Designation The Tally Reserve</li> <li>Vineyard n/a</li> <li>Country Australia</li> <li>Region South Australia</li> <li>SubRegion Limestone Coast</li> <li>Appellation Coonawarra</li> </ul>

3条回答

网友

1楼 · 编辑于 2024-10-02 00:29:51

您可以迭代bs4对象的contents属性：

from bs4 import BeautifulSoup as soup
d = [[getattr(c, 'text', c).strip() for c in i] for i in soup(html, 'html.parser').find_all('li')]

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-10-02 00:29:51

也许你可以试试这个：

for li_tag in soup.find_all('ul', {'class':'twin-set-list'}):
for span_tag in li_tag.find_all('li'):
    field = span_tag.find('span').text
    value = span_tag.text
    value = value[len(field)+1:]
    need[field] = value

以防万一，若“value”中有相同的字段，不要替换它，而是使用substring。在

网友

3楼 · 编辑于 2024-10-02 00:29:51

您可以通过以下方式替换代码：

field = span_tag.find('span').text 
value = span_tag.text.replace(field,'')

它不是很干净，但它可以与您的代码一起工作。在

如何使用python获取<li>和<span>标记中的每个值

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用python获取<li>和<span>标记中的每个值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >