Python从本地htmlfi提取信息

# First try soup = BeautifulSoup('file:///H:/Approx_google_code/tiny20.html') soup.findall('PATTERN:') # Second try re.search( "PATTERN:", 'file:///H:/Approx_google_code/tiny20.html') # Third try soup.body.findAll(text='PATTERN:') # Forth try soup.body.findAll(text=re.compile('PATTERN:'))

1条回答

网友

1楼 · 发布于 2024-10-02 12:27:47

找到包含PATTERN:文本的元素，找到font父元素并获得下一个font同级元素：

soup = BeautifulSoup(data)

for elm in soup.find_all(text="PATTERN:"):
    print elm.find_parent("font").find_next_sibling("font").get_text(strip=True)

演示：

^{pr2}$

注意，由于我已经安装了lxml，BeautifulSoup将其用作底层解析器。我也尝试过html.parser，它对我有效。html5lib与前两个不同。无论如何，请显式指定解析器：

soup = BeautifulSoup(data, "lxml")

或者：

soup = BeautifulSoup(data, "html.parser")

编程相关推荐

地理编码器java gwt
如何在Java中将Json节点插入到另一个节点中？
java什么会导致重新创建安卓数据库？
java从hashmap中获得5个最高值，同时保留插入顺序
JavaStruts：使用进度条上传文件
不依赖于用户偏好的java时间
启动应用程序的java问题
java如果找不到文件，如何显示错误消息？
java如何知道一个标记是包含一个值还是另一个标记？
另一个类的try-catch块中的java Invoke方法

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python从本地htmlfi提取信息

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >