我正在分析一个页面
http://gwyneddathletics.com/custompages/sport/mlacrosse/stats/2014/ml0402gm.htm
当我试着找到“b”时,我没有得到任何结果,“tr”也是一样。除了最初的标题标签,我找不到任何东西。你知道吗
另外,当我执行soup=BeautifulSoup(标记)并打印soup时,我会在输出的末尾得到一个额外的页面
我使用的是python2.6和beautifulsoup3.2.0。为什么我的汤没有正确解析页面?你知道吗
Tags:
很可能BeautifulSoup使用的解析器真的不喜欢页面上的标记,我以前也遇到过类似的问题。我对您的输入做了一个快速测试,发现如果您升级到最新的BeautifulSoup(包名为bs4),它就可以正常工作了。bs4还支持python2.6,它和BeautifulSoup(3.x系列)之间向后不兼容的变化很小。如果您需要查看如何移植,请参阅here。你知道吗
相关问题 更多 >
编程相关推荐