获取字幕的python脚本

2024-10-05 11:25:44 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我在为我的应用做这个网站的抓取。我需要下载验证码图像显示给用户。但每次我访问验证码url时,它都会生成一个新的验证码。如何下载自动登录的动态生成的验证码

例如:https://academics.vit.ac.in/student/stud_login.asp

在这里,我使用以下脚本下载验证码>;>>

from bs4 import BeautifulSoup
import urllib2
import urllib

url = "https://academics.vit.ac.in/student/stud_login.asp"
content = urllib2.urlopen(url)
soup = BeautifulSoup(content)
img = soup.find('img',id ='imgCaptcha')
print img
urllib.urlretrieve(img['src'],'captcha.bmp')

但有些脚本似乎不起作用。在

1)一种解决方案是截图并剔除验证码。 但是我需要一个不同的解决方案,因为我要在不同屏幕大小的设备上工作,所以拍摄屏幕快照并不能解决这个问题。在


Tags: inhttpsimport脚本urlimgloginstudent
1条回答
网友
1楼 · 发布于 2024-10-05 11:25:44

img['src']返回一个相对url-captcha.asp。在使用它之前,必须将其转换为绝对url(https://academics.vit.ac.in/student/captcha.asp)。在

import urlparse
urllib.urlretrieve(urlparse.urljoin(url, img['src']), 'captcha.bmp')

相关问题 更多 >

    热门问题