如何在python中刮取标签文本？

<div class="sidearm-roster-player-image column"> <a data-bind="click: function() { return true; }, clickBubble: false" href="/sports/mens-swimming-and-diving/roster/gregory-becker/3555" aria-label="Gregory Becker - View Full Bio" title="View Full Bio"> <img class="lazyload" data-src="/images/2018/10/19/GREGORY_BECKER.jpg?width=80" alt="GREGORY BECKER"> </a> </div>

2条回答

网友

1楼 · 编辑于 2024-10-16 20:43:23

下面是帮助您从a标记中提取名称的代码

from bs4 import BeautifulSoup

with open("<path-to-html-file>") as fp:
    soup = BeautifulSoup(fp, 'html.parser') #parse the html
    
tags = soup.find_all('a') # get all the a tag
for tag in tags:
    print(tag.get('aria-label')) #get the required text

网友

2楼 · 编辑于 2024-10-16 20:43:23

您可以在BeautifulSoup中使用.get()方法。首先使用任何选择器或find/find_all选择elem中的元素或任何其他变量。然后尝试：

print(elem.get('aria-label'))

编程相关推荐

java希望直接扫描要上传到网页的文档
java JavaFX使对象可见，但不使用（忽略）点击
java LibGdx奇怪的纹理行为
java JavaFx ComboBox在第一次单击时未获得正确的值
api WebDav服务器库最好使用Java
java在Android中维护应用程序状态
java保存在Android中拖放RecyclerView后所做的更改我已经阅读了所有内容
无法读取项目中所需库tomcatembedwebsocket的java存档，或者该存档不是有效的ZIP文件
c#类在系统中有哪些关联？如何在UML中最好地表示它们？
java如何使用bazaar访问两台计算机上的同一文件夹

相关问题更多 >

编程相关推荐

热门问题

热门文章