使用Python&BeautifulSoup刮取HTML标记标识符值

2条回答

网友
1楼 · 编辑于 2024-06-23 02:42:39

要获取element的attributes，可以使用.get()方法（python3），即：
<A CLASS="someClass" uniqueID="someValue" anotherID="someOtherValue"> Here is the data I can scrape right now. </A>
_as = xmlSoup.find_all('a') for a in _as : print(a.get('CLASS')) print(a.get('uniqueID')) print(a.get('anotherID')) print(a.text))
上面将循环html中的所有a标记，并打印每个标记的指定属性

网友
2楼 · 编辑于 2024-06-23 02:42:39

请看我贴出的评论中的链接，但我认为你是在尝试这样做
soup.find("a", {"uniqueID": "someValue"})
如果你要发布一个代码示例，我可以对其进行裁剪，但由于你没有这样做，这是相当通用的

编程相关推荐

导入扫描程序后出现java编译错误
java如何在字符串中查找元音，并在屏幕上打印元音最多的单词？
java Libgdx robovm生成错误
java Eclipse条件断点仅在其他断点之后
java IntelliJ Idea JavaFX调试问题
如果字符串*仅*包含字符集中的*所有*字符，再加上一个可选字符，则匹配java正则表达式
java禁用实体、DTO包上的声纳复制
java如何使用正则表达式获取HTML标记中的字符串数据
使用Enum和billpugh方法的java通用单例
java如何在我的安卓应用程序中建立VPN连接（Cisco IPSec Xauth PSK），而不是通过安卓内置的VPN工具激活它？

相关问题更多 >

编程相关推荐

热门问题

热门文章