靓汤Python刮网

网友

1楼 · 编辑于 2024-06-28 19:19:34

加上Ajax1234的答案。如果通过其他html属性进行搜索：

from bs4 import BeautifulSoup
s = """
<h1 class="protect" data-category="Jackets" data-ino="SS18J42" data-
rd="02/22/2018" data-rw="1SS18" itemprop="name">Gradient Puffy Jacket</h1>
"""
soup = BeautifulSoup(s, 'html.parser')

print(soup.find('h1', {'class': 'protect'}).text)
print(soup.find('h1', {'data-category': 'Jackets'}).text)
print(soup.find('h1', {'data-ino': 'SS18J42'}).text)

等等。。。在

网友

2楼 · 编辑于 2024-06-28 19:19:34

您可以使用BeautifulSoup：

from bs4 import BeautifulSoup as soup
s = """
 <h1 class="protect" data-category="Jackets" data-ino="SS18J42" data-
rd="02/22/2018" data-rw="1SS18" itemprop="name">Gradient Puffy Jacket</h1>
"""
new_s = soup(s, 'lxml').find('h1', {'itemprop':'name'}).text

输出：

^{pr2}$

网友

3楼 · 编辑于 2024-06-28 19:19:34

BeautifulGroup允许您使用属性访问元素，因此可以使用以下方法：

from bs4 import BeautifulSoup

html = """<h1 class="protect" data-category="Jackets" data-ino="SS18J42" data-
rd="02/22/2018" data-rw="1SS18" itemprop="name">Gradient Puffy 
Jacket</h1>"""

soup = BeautifulSoup(html, "html.parser")
print soup.h1.text

相关问题更多 >

编程相关推荐

热门问题

热门文章

靓汤Python刮网

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >