Python wget 保存文件,如何获取数据到变量中

2024-10-01 13:26:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我在python中使用wget作为

import wget
from bs4 import BeautifulSoup
url = "https://www.facebook.com/hellomeets/events"

down = wget.download(url)
print down

它将html数据下载到一个文件中。但我想要变量。我是python新手。任何帮助都将不胜感激。 提前谢谢


Tags: fromhttpsimportcomurlfacebookdownloadwww
1条回答
网友
1楼 · 发布于 2024-10-01 13:26:44

您不需要使用wget将HTML下载到一个文件中然后读入,您只需直接获取HTML即可。这是在使用requests(在我看来比pythons urllibs要好得多)

import requests
from bs4 import BeautifulSoup
url = "https://www.facebook.com/hellomeets/events"

html = requests.get(url).text
print html

这是一个使用urllib2内置的Python的示例:

^{pr2}$

编辑

我知道你从网站直接获得的HTML和从wget模块获得的HTML之间的区别是什么意思。下面是使用wget模块执行此操作的方法:

import wget
from bs4 import BeautifulSoup
url = "https://www.facebook.com/hellomeets/events"

down = wget.download(url)

f = open(down, 'r')
htmlText = "\n".join(f.readlines())
f.close()
print htmlText

相关问题 更多 >