2024-10-01 13:26:44 发布
网友
我在python中使用wget作为
import wget from bs4 import BeautifulSoup url = "https://www.facebook.com/hellomeets/events" down = wget.download(url) print down
它将html数据下载到一个文件中。但我想要变量。我是python新手。任何帮助都将不胜感激。 提前谢谢
您不需要使用wget将HTML下载到一个文件中然后读入,您只需直接获取HTML即可。这是在使用requests(在我看来比pythons urllibs要好得多)
wget
import requests from bs4 import BeautifulSoup url = "https://www.facebook.com/hellomeets/events" html = requests.get(url).text print html
这是一个使用urllib2内置的Python的示例:
urllib2
我知道你从网站直接获得的HTML和从wget模块获得的HTML之间的区别是什么意思。下面是使用wget模块执行此操作的方法:
import wget from bs4 import BeautifulSoup url = "https://www.facebook.com/hellomeets/events" down = wget.download(url) f = open(down, 'r') htmlText = "\n".join(f.readlines()) f.close() print htmlText
您不需要使用
wget
将HTML下载到一个文件中然后读入,您只需直接获取HTML即可。这是在使用requests(在我看来比pythons urllibs要好得多)这是一个使用
^{pr2}$urllib2
内置的Python的示例:编辑
我知道你从网站直接获得的HTML和从
wget
模块获得的HTML之间的区别是什么意思。下面是使用wget
模块执行此操作的方法:相关问题 更多 >
编程相关推荐