beautifulGroup:嵌套元素

<div id="quick-facts-container" class="SideBox"> <ul class="ListStack ListStack--float"> <li> Impact Factor 0.806 </li> <li> Available 1996 - 2017 </li> <li> Volumes 22 </li> <li> Issues 265 </li> </ul> </div>

2条回答

网友

1楼 · 编辑于 2024-06-02 12:59:55

以下措施应该有效：

from bs4 import BeautifulSoup

r = urllib.request.urlopen('file:///197.html').read()
soup = BeautifulSoup(r, 'html.parser')

data = [i.text for i in soup.find(id='quick-facts-container').li.find_all('span')]
print("{} ({})".format(data[0], data[1]))

将显示：

^{pr2}$

网友

2楼 · 编辑于 2024-06-02 12:59:55

如果只需要文档或标记的文本部分，则可以使用get_text（）方法。它以单个Unicode字符串的形式返回文档中或标记下的所有文本：

In [6]: for li in soup.find('div', id='quick-facts-container').find_all('li'):
   ...:     print(li.get_text(strip=True))
   ...:     
Impact Factor0.806
Available1996 - 2017

相关问题更多 >

编程相关推荐

热门问题

热门文章

beautifulGroup:嵌套元素

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >