我尝试使用beauthoulsoup的find_all()来搜索具有标记“div”和类“wisbb_name”的元素。我正在抓取的HTML来自,http://www.foxsports.com/mlb/scores。我的最终目标是根据网站上显示的当天起跑的所有投手的名字。下面是投手名字的HTML
<div class="wisbb_name">M. Fiers</div>
所有投手的HTML代码都有相同的类,只是与之相关的文本不同。我已经使用下面的代码行获取find_all()的所有结果并获取与之相关的文本。在
for el in soup.find():
print(el.get_text())
这很好,问题是find_all()找不到我想要它找到的元素,不管我如何修改参数。根据beauthulsoupdocumentation,下面的代码行应该找到具有类“wisbb_name”和标记“div”的元素。在
^{pr2}$在打印变量时,我只得到一个空列表。我不确定我是不是在python中采用了错误的方法,或者我需要进一步了解HTML是如何工作的。我有最新版本的beauthoulsoup,我使用的是python3.6.2。我当前的完整代码如下。在
import requests
from bs4 import BeautifulSoup
page = requests.get("url from top because I can't use 3 links")
soup = BeautifulSoup(page.content, "lxml")
for el in soup.find_all("div", class_="wisbb_name"):
print(el.get_text())
文本用JavaScript呈现。 首先用dryscrape呈现页面
输出:
^{pr2}$或者用硒。。。 首先安装:
然后找个司机https://sites.google.com/a/chromium.org/chromedriver/downloads
或PyQt5:
相关问题 更多 >
编程相关推荐