我无法从单个标签获取数据。单个标记有许多数据属性,如姓名、电话、公司和url。我需要从许多标签和所有类似于这个标签的标签中获取数据。你知道吗
HTML代码:
<div class="ListingDetails">
<div class="ListingDisplayName">
<a href="/members/jeremy.counter1/default.aspx">
Jeremy Counter
</a>
</div>
Mortgage Officer -
American Pacific Mortgage<br>
Anchorage, Alaska 99503<br>
phone: (907) 519-
6656 | (907) 250-0766
<div class="listingurl">
<a rel="nofollow" href="http://www.jeremycounter.com" target="_blank">
jeremycounter.com
</a>
</div>
</div>
Python代码:
data=requests.get(url)
soup=bs4.BeautifulSoup(data.text,'html.parser')
page = soup.find('div', class_="CommonContentBox DirectoryListings")
listing_box = page.find('div', class_="BusinessListingUser")
name = listing_box.find('div', class_="ListingDisplayName").text
#print(name)
details = listing_box.find('div',
class_="ListingDetails").text.strip('\n\t\r')
print(details)
输出:
Tyler Tullis
-
Montgomery, Alabama 36117
| (334) 322-3707
谁能告诉我获取数据的最佳解决方案。你知道吗
预期结果:
name: Jeremy Counter
phone: (907) 519-6656
company: American Pacific Mortgage
url: jeremycounter.com
基于你的html你可以尝试下面的代码。你知道吗
输出:
这里不需要硒。只需拉取数据并对其进行迭代即可清理并打印:
输出:
附加:
您可以将selenium用于此任务:
输出:
相关问题 更多 >
编程相关推荐