keitazoumana/with_pyPDF.py

## with_pyPDF.py
from PyPDF2 import PdfFileReader

# creating a pdf file object
pdfObject = open('./data/obama-worlds-matter.pdf', 'rb')

# creating a pdf reader object
pdfReader = PdfFileReader(pdfObject)

# Extract and concatenate each page's content
text=''
for i in range(0,pdfReader.numPages):
    # creating a page object
    pageObject = pdfReader.getPage(i)
    # extracting text from page
    text += pageObject.extractText()
print(text)
	from PyPDF2 import PdfFileReader

	# creating a pdf file object
	pdfObject = open('./data/obama-worlds-matter.pdf', 'rb')

	# creating a pdf reader object
	pdfReader = PdfFileReader(pdfObject)

	# Extract and concatenate each page's content
	text=''
	for i in range(0,pdfReader.numPages):
	# creating a page object
	pageObject = pdfReader.getPage(i)
	# extracting text from page
	text += pageObject.extractText()
	print(text)