BeautifulSoup无法解析长视图

1条回答

网友

1楼 · 发布于 2024-09-30 10:27:26

beauthoulsoup使用pluggable HTML parser来构建“soup”；您需要尝试不同的解析器，因为每个解析器都会对断开的页面进行不同的处理。在

但是，我在使用任何解析器解析该页面时没有问题：

>>> from beautifulsoup4 import BeautifulSoup
>>> import requests
>>> r = requests.get('http://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0')
>>> for parser in ('html.parser', 'lxml', 'html5lib'):
...     print repr(str(BeautifulSoup(r.text, parser))[-60:])
... 
';\r\npageTracker._trackPageview();\r\n</script>\n</body>\n</html>\n'
'();\r\npageTracker._trackPageview();\r\n</script>\n</body></html>'
'();\npageTracker._trackPageview();\n</script>\n\n\n</body></html>'

请确保安装了最新的BeautifulSoup4包，我在4.1系列中看到了4.2中解决的一致问题。在

编程相关推荐

java为九个按钮编写for循环
GridLayout的java问题
使用Apache POI XSSF将Unicode字符从Java写入Excel文件“.xlsx”
java如何在安卓 studio中从recycler视图向SQLite数据库添加数据
从视图传递日期的html。jsp到我的javaportlet
java使用卡片布局，卡片不交换？
java需要一个函数来限制一条线（通过它的坐标知道）的长度
java我可以用Jersey（和MOXy）发送对象数组吗？
java决定在Spring Boot应用程序中使用多个实现中的哪一个
java Eclipse如何在junit测试替换变量之前执行maven构建？

相关问题更多 >

编程相关推荐

热门问题

热门文章

BeautifulSoup无法解析长视图

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >