无法使用BeautifulGroup刮取HTML表

1条回答

网友

1楼 · 发布于 2024-09-30 18:23:30

1）首先，要获得“目标”，你需要找到所有，而不是find。然后，考虑到您确切地知道您的目标将在哪个位置（在您给出的示例中，它是index=2），解决方案可以这样实现：

from bs4 import BeautifulSoup

html = """(YOUR HTML)"""

soup = BeautifulSoup(html, 'html.parser')
table = soup.find('div', {'class': 'sastrupp-class'})
all_keys = table.find_all('td', {'class': 'key'})
my_key = all_keys[2]

print my_key.text  # prints 'Target'

（二）

There are other < div>s with class="sastrupp-class" on the site

同样，您需要使用find\u all选择所需的索引，然后选择正确的索引。在

HTML示例：

^{pr2}$

要提取目标，只需：

all_divs = soup.find_all('div', {'class':'sastrupp-class'})
target = all_divs[3]  # assuming you know exactly which index to look for

编程相关推荐

多线程Java Swing定时器和线程&For循环中只执行最后一个命令
java使用@query使用Spring数据创建自定义查询
java如何在多模块Maven项目中自动重用依赖项版本？
java Mongo/JPA IllegalArgumentException解析地理本机查询
accesscontrolexception java。伊奥。从“user.dir”读取时的文件权限
mysql我可以将表名作为参数传递给java准备的语句吗？
java从当前livy会话访问数据文件
运行JUnit测试时未找到java类异常
当来自其他包的类失败时，java方法调用失败
java Tomcat服务器显示无法启动

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法使用BeautifulGroup刮取HTML表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >