嗨,我正在尝试使用python将一堆pdf转换成图像
这是我的密码:
有人能帮我澄清一下我做错了什么吗
import os
import cv2
from pdf2image import convert_from_path
import os
import sys
import time
import cv2
import numpy as np
import pytesseract
import threading
arr = os.listdir(r'C:\Users\Ramesh\Desktop\Parsing_Project\Resumes_pdf')
print(arr)
outputDir = (r"C:\Users\Ramesh\Desktop\Parsing_Project\Resumes")
def convert(file, outputDir):
outputDir = outputDir + str(round(time.time())) + '/'
if not os.path.exists(outputDir):
os.makedirs(outputDir)
pages = convert_from_path(file, 500)
counter = 1
for page in pages:
myfile = outputDir +'output' + str(counter) +'.jpg'
counter = counter + 1
page.save(myfile, "JPEG")
return (myfile)
for file in arr:
myfile = convert('C:\\User\\Ramesh\\Desktop\\Parsing_Project\\Resumes_pdf\\' + file, outputDir)
我得到的错误如下图所示
arr
包含目录C:\Users\Ramesh\Desktop\Parsing_Project\Resumes_pdf
中文件的名称您试图打开一个文件,但位置错误。 尝试将代码更改为:
请注意,反斜杠必须用反斜杠转义,否则python将无法识别结束引号,并给出EOL(行尾)错误
请尝试此代码,它只打开pdf文件并读取一行,不涉及
pdf2image
:如果它打印出的行没有错误,pdf文件和路径也正常,因此您的
pdf2image
必须被破坏,否则请发布错误,以便我可以进一步帮助您我找到了一种从特定路径传递文件地址的方法,并使用blob函数在每个文件上循环
以下是我使用的代码:
谢谢你的帮助:)
相关问题 更多 >
编程相关推荐