所以我在为我的应用做这个网站的抓取。我需要下载验证码图像显示给用户。但每次我访问验证码url时,它都会生成一个新的验证码。如何下载自动登录的动态生成的验证码
例如:https://academics.vit.ac.in/student/stud_login.asp
在这里,我使用以下脚本下载验证码>;>>
from bs4 import BeautifulSoup
import urllib2
import urllib
url = "https://academics.vit.ac.in/student/stud_login.asp"
content = urllib2.urlopen(url)
soup = BeautifulSoup(content)
img = soup.find('img',id ='imgCaptcha')
print img
urllib.urlretrieve(img['src'],'captcha.bmp')
但有些脚本似乎不起作用。在
1)一种解决方案是截图并剔除验证码。 但是我需要一个不同的解决方案,因为我要在不同屏幕大小的设备上工作,所以拍摄屏幕快照并不能解决这个问题。在
img['src']
返回一个相对url-captcha.asp
。在使用它之前,必须将其转换为绝对url(https://academics.vit.ac.in/student/captcha.asp
)。在相关问题 更多 >
编程相关推荐