JulianaGuama/pdfExtract.py

## pdfExtract.py
#imports
from PIL import Image
import pytesseract as ptr
import cv2

TESSDATA_PREFIX = r'C:/Users/your-user/AppData/Local/Tesseract-OCR'
ptr.pytesseract.tesseract_cmd = r"C:\Users\your-user\AppData\Local\Tesseract-OCR\tesseract.exe"

filename = r'C:/Users/your-user/fileLocal/file.jpg'
pdf = cv2.imread(filename, cv2.IMREAD_GRAYSCALE)

pdfNF = ptr.image_to_string(pdf, lang='por')
print (pdfNF)
	#imports
	from PIL import Image
	import pytesseract as ptr
	import cv2

	TESSDATA_PREFIX = r'C:/Users/your-user/AppData/Local/Tesseract-OCR'
	ptr.pytesseract.tesseract_cmd = r"C:\Users\your-user\AppData\Local\Tesseract-OCR\tesseract.exe"

	filename = r'C:/Users/your-user/fileLocal/file.jpg'
	pdf = cv2.imread(filename, cv2.IMREAD_GRAYSCALE)

	pdfNF = ptr.image_to_string(pdf, lang='por')
	print (pdfNF)