使用Python机械化Javascript表单提交的Screenscaping aspx

<form method="post" action="QuickSearch.aspx?q=po30" onsubmit="javascript:return WebForm_OnSubmit();" onkeypress="javascript:return WebForm_FireDefaultButton(event, 'ctl00_ContentPlaceHolder1_buttonSearch')" id="aspnetForm"> <input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" /> <input type="hidden" name="__EVENTARGUMENT" id="__EVENTARGUMENT" value="" /> <input type="hidden" name="__LASTFOCUS" id="__LASTFOCUS" value="" />

2条回答

网友

1楼 · 编辑于 2024-06-26 01:33:21

Mechanize不处理javascript，但对于这种特殊情况，它是不需要的。

首先我们用mechanize打开结果页

url = 'http://ratings.food.gov.uk/QuickSearch.aspx?q=po30'
br = mechanize.Browser()
br.set_handle_robots(False)
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
br.open(url)
response = br.response().read()

然后我们选择aspnet表单：

br.select_form(nr=0) #Select the first (and only) form - it has no name so we reference by number

表单有5个提交按钮-我们要提交一个按钮，将我们带到下一个结果页：

response = br.submit(name='ctl00$ContentPlaceHolder1$uxResults$uxNext').read()  #"Press" the next submit button

表单中的其他提交按钮包括：

ctl00$uxLanguageSwitch # Switch language to Welsh
ctl00$ContentPlaceHolder1$uxResults$Button1 # Search submit button
ctl00$ContentPlaceHolder1$uxResults$uxFirst # First result page
ctl00$ContentPlaceHolder1$uxResults$uxPrevious # Previous result page
ctl00$ContentPlaceHolder1$uxResults$uxLast # Last result page

在mechanize中，我们可以获得如下表单信息：

for form in br.forms():
    print form

网友

2楼 · 编辑于 2024-06-26 01:33:21

Mechanize不处理JavaScript。

但是，有很多方法可以处理这个问题，包括QtWebKit、python-spidermonkey、HtmlUnit（使用Jython）或SeleniumRC。

以下是硒的使用方法：

import selenium
sel=selenium.selenium("localhost",4444,"*firefox", "http://ratings.food.gov.uk")   
sel.start()
sel.open("QuickSearch.aspx?q=po30")
sel.click('ctl00$ContentPlaceHolder1$uxResults$uxNext')

另请参见这些相关的SO问题：

相关问题更多 >

编程相关推荐

热门问题

热门文章