2024-09-27 21:30:12 发布
网友
把文本打印到控制台
<html> <body> <p> }" </p> <div class='\"message-container\"' id='\"m154862032\"' > ...
但是当我试图提取消息容器div时,我得到了一个空列表
HTML格式不正确,属性值中包含嵌入的反斜杠和引号。在搜索类时,必须包括以下引号:
>>> from bs4 import BeautifulSoup >>> sample = r''' ... <html> ... <body> ... <p> ... }" ... </p> ... <div class='\"message-container\"' id='\"m154862032\"' > ... ''' >>> soup = BeautifulSoup(sample) >>> soup.find_all('div', class_=r'\"message-container\"') [<div class='\"message-container\"' id='\"m154862032\"'> </div>]
我在这里使用了原始字符串文本(r'...'),以避免反斜杠被解释为转义序列;这样就不必将它们加倍。在
r'...'
HTML格式不正确,属性值中包含嵌入的反斜杠和引号。在搜索类时,必须包括以下引号:
我在这里使用了原始字符串文本(
r'...'
),以避免反斜杠被解释为转义序列;这样就不必将它们加倍。在相关问题 更多 >
编程相关推荐