python如何解析htm

url = "http://german-bash.org/action/random" response = urllib2.urlopen(url) html = response.read() soup = BeautifulSoup(html) for div in soup.findAll('div','zitat'): output = div.find('span', 'quote_zeile').string print(output)

1条回答

网友

1楼 · 发布于 2024-09-25 00:31:19

您只获取第一个这样的<span>。再次使用.findAll()查找所有此类跨度：

html = response.read()
soup = BeautifulSoup(html, from_encoding=response.info().getparam('charset'))
for div in soup.findAll('div','zitat'):
    for span in div.findAll('span', 'quote_zeile'):
        print span.string

这会产生：

^{pr2}$

请注意，我还告诉BeautifulSoup要使用什么编码，取自响应Content-Type报头；这对这个页面很重要，因为没有它，beauthoulsoup就猜错了。在

编程相关推荐

调试如何使用VIM/GVIM调试Java应用程序？
java Tomcat 8+OPenJDK 8 64位内存使用率
算法希尔密码加密/解密源代码Java（2 x 2矩阵密钥）
番石榴中有没有类似于功能性Java的效果？
Java算法：检查字典中是否有字符串
java如何从lambda中获取变量？
获取当前jar文件名的java
java LinkedList：如何将当前节点分配给它后面的节点？删除当前节点时
以与ImageMagick的“identify”命令相同的方式在Java中获取图像质量
java是否可以在运行时使用JAXR创建Web服务？

相关问题更多 >

编程相关推荐

热门问题

热门文章

python如何解析htm

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >