#!/usr/bin/env python
from contextlib import closing
from selenium.webdriver import Firefox # pip install selenium
url = "http://busymovies.appspot.com/News.html?id=2965032"
# use firefox to get page with javascript generated content
with closing(Firefox()) as browser:
browser.get(url)
link = browser.find_element_by_link_text("Direct Link")
print link.get_attribute("href")
要提取动态生成(使用javascript)的内容,可以使用selenium:
输出
^{pr2}$在视频的正下方有一个叫做“直接链接”的链接。现在如果你打开源代码,你会看到它的结构。在
您需要做的就是用
id=directlink
解析到这个节点的HTML&get。你可以用BeautifulSoup来做这个。你们都准备好了。。。在相关问题 更多 >
编程相关推荐