在python中使用scrapy结合基本url从图像中获取文本？

2024-09-30 00:30:30 发布

男 | 程序猿一只，喜欢编程写python代码。

我试过这个代码：

src1 = "https://hms.harvard.edu/"<br/>
src = response.css('div.person-line > div > 
      img::attr("src")').extract_first()<br/>
src = sites/default/files/hms-faculty-emails/BX0UVXkP.jpg <br/>
import urlparse <br/>
urlparse.urljoin(src1, src)<br/>
https://hms.harvard.edu/sites/default/files/hms-faculty-emails/BX0UVXkP.jpg<br/>
src2 = urlparse.urljoin(src1,src)<br/>
email = pytesseract.image_to_string(Image.open(src2))<br/>

我得到了这个错误

ioerror errno 22 invalid mode ('rb') or filename

如何从文本图像中提取电子邮件文本…有人能帮忙吗？你知道吗

Tags： https br div src default files sites hms

1条回答

网友

1楼 · 发布于 2024-09-30 00:30:30

您应该使用io.BufferIO缓冲区，因为您使用http路径调用函数image_to_string。您需要编写如下代码：

def get_text(src):
    response = urlopen(src)
    buffer = io.BytesIO(response.read())
    return pytesseract.image_to_string(Image.open(buffer))

在python中使用scrapy结合基本url从图像中获取文本？

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中使用scrapy结合基本url从图像中获取文本？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >