BeautifulSoup如何在不打开标签和<br>标签之前提取文本？

2条回答

网友

1楼 · 编辑于 2024-10-01 15:46:12

如果您不需要在不同变量中查找的3个元素中的每一个，那么您可以使用<div>上的get_text()函数将它们全部放在一个字符串中。如果还有其他的div标记，但是它们都有类，那么您可以找到所有带有class=false的{}。如果您不能隔离您感兴趣的<div>，那么此解决方案将不适用于您。在

import urllib
from bs4 import BeautifulSoup    
data = urllib.urlopen(url).read()
soup = BeautifulSoup(data, "html.parser")

for name in soup.find_all("div", class=false)
     print name.get_text().strip()

顺便说一句，这是python3&bs4

网友

2楼 · 编辑于 2024-10-01 15:46:12

找到h4元素并使用^{}：

h4s = soup.find_all("h4", class_="actorboxLink")
for h4 in h4s:
    for text in h4.find_next_siblings(text=True):
        print(text.strip())

编程相关推荐

java WeakHashMap的实际用途是什么？
从JavaScript中的输入中获取一个值，并在Java中使用它
JavaJDBI支持带out参数的存储过程
用于识别for/while循环的java ASM字节码
java如何一次访问拆分字符串的两个元素？
从数据库加载详细信息时光标出现java错误
JavaSpring在运行时注册作用域bean
java我将加密文本写入程序中的一个文件，但无法解密该文件中的文本
java从JAR文件访问源文件
java如何更改安卓应用程序中屏幕活动的时间（始终处于活动状态、充电时处于活动状态、正常）

相关问题更多 >

编程相关推荐

热门问题

热门文章

BeautifulSoup如何在不打开标签和<br>标签之前提取文本？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >