查询后无法获取整个网页

2024-06-28 11:00:05 发布

您现在位置：Python中文网/ 问答频道 /正文

4458

网友

男 | 程序猿一只，喜欢编程写python代码。

我正试图从以下页面中找到历史NAVPS表：
http://www.philequity.net/pefi_historicalnavps.php

这里的所有代码都是我的最小工作脚本的内容。首先是：

import urllib
import urllib2
from BeautifulSoup import BeautifulSoup

opener = urllib2.build_opener()
urllib2.install_opener(opener)

在使用Chrome的Inspect元素研究网页之后，我发现发送的表单数据如下：

form_data = {}
form_data['mutualFund'] = '1'
form_data['year'] = '1995'
form_data['dmonth'] = 'Month'
form_data['dday'] = 'Day'
form_data['dyear'] = 'Year'

所以我继续提出要求：

url = "http://www.philequity.net/pefi_historicalnavps.php"
params = urllib.urlencode(form_data)
request = urllib2.Request(url, params)

我希望这相当于在填写表单后单击“Get NAVPS”：

page = urllib2.urlopen(request)

然后我用BeautifulSoup读了它：

soup = BeautifulSoup(page.read())
print soup.prettify()

但是唉！我只得到网页，好像我没有点击“getnavps”:(我遗漏了什么吗？服务器是否以单独的流发送表？我怎么去？你知道吗

Tags： import form http data net www opener urllib2

1条回答

网友

1楼 · 发布于 2024-06-28 11:00:05

当我在firebug中查看POST请求时，我又看到了一个您没有传递的参数：“type”是“Year”。我不知道这是否能为你得到数据，还有很多其他原因它可能无法为你提供数据。你知道吗

查询后无法获取整个网页

相关问题更多 >

编程相关推荐

热门问题

热门文章

查询后无法获取整个网页

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >