zchen24/get_all_pdf_titles.py

## get_all_pdf_titles.py
#!/usr/bin/env python

from pdfrw import PdfReader
import glob

fobj = open('alltitles.txt', 'w')   # output file
allpdf = glob.glob('./*.pdf')       # assuming all PDF files in current dir
for fname in allpdf:
    ipdf = PdfReader(fname)
    title = ipdf.Info.get('/Title')

    print 'file  = ' + fname
    print 'title = ' + title
    fobj.write(title[1:-1] + ' ')   # in my case title has "()"
    # import ipdb; ipdb.set_trace()

fobj.close()
	#!/usr/bin/env python

	from pdfrw import PdfReader
	import glob

	fobj = open('alltitles.txt', 'w') # output file
	allpdf = glob.glob('./*.pdf') # assuming all PDF files in current dir
	for fname in allpdf:
	ipdf = PdfReader(fname)
	title = ipdf.Info.get('/Title')

	print 'file = ' + fname
	print 'title = ' + title
	fobj.write(title[1:-1] + ' ') # in my case title has "()"
	# import ipdb; ipdb.set_trace()

	fobj.close()