jmtaysom/ocr.py

## ocr.py
import glob
import PIL
import pytesseract


for image in glob.glob(r'/Users/me/condo/word/media/*.jpg'):
    txt = pytesseract.image_to_string(PIL.Image.open(image))
    image_id = image.split('/')[-1].split('.')[0].replace('image','')
    with open('/Users/me/condo/text/{}.txt'.format(image_id), 'w') as f:
        f.writelines(txt)
	import glob
	import PIL
	import pytesseract


	for image in glob.glob(r'/Users/me/condo/word/media/*.jpg'):
	txt = pytesseract.image_to_string(PIL.Image.open(image))
	image_id = image.split('/')[-1].split('.')[0].replace('image','')
	with open('/Users/me/condo/text/{}.txt'.format(image_id), 'w') as f:
	f.writelines(txt)