BeautifulSoup未解析标题标记

2024-10-03 04:25:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在分析一个页面

http://gwyneddathletics.com/custompages/sport/mlacrosse/stats/2014/ml0402gm.htm

当我试着找到“b”时,我没有得到任何结果,“tr”也是一样。除了最初的标题标签,我找不到任何东西。你知道吗

另外,当我执行soup=BeautifulSoup(标记)并打印soup时,我会在输出的末尾得到一个额外的页面

我使用的是python2.6和beautifulsoup3.2.0。为什么我的汤没有正确解析页面?你知道吗


Tags: comhttp标题stats页面标签trsoup
1条回答
网友
1楼 · 发布于 2024-10-03 04:25:10

很可能BeautifulSoup使用的解析器真的不喜欢页面上的标记,我以前也遇到过类似的问题。我对您的输入做了一个快速测试,发现如果您升级到最新的BeautifulSoup(包名为bs4),它就可以正常工作了。bs4还支持python2.6,它和BeautifulSoup(3.x系列)之间向后不兼容的变化很小。如果您需要查看如何移植,请参阅here。你知道吗

相关问题 更多 >