misterhay/extract-minecraft-portfolio-images.py

## extract-minecraft-portfolio-images.py
# python -m pip install PyMuPDF Pillow

import os # for files and directories
import io # for bytes
import fitz #PyMuPDF
from PIL import Image #Pillow

for root, dirs, files in os.walk("."):
    for filename in files:
        if filename.endswith('.pdf'):
            file = os.path.join(root, filename)
            pdf_file = fitz.open(file)
            for i in range(len(pdf_file)):
                page = pdf_file[i]
                image_list = page.get_images()
                for image_index, img in enumerate(image_list, start=1):
                    xref = img[0] # get image XREF
                    base_image = pdf_file.extract_image(xref)
                    image_bytes = base_image["image"] # extract image bytes
                    image_ext = base_image["ext"] # get image extension
                    image = Image.open(io.BytesIO(image_bytes)) # load image bytes to PIL
                    image_filename = filename.split('.')[0] + '_' + str(i) + '_' + str(image_index) + '.' + image_ext
                    image.save(image_filename, image_ext)
	# python -m pip install PyMuPDF Pillow

	import os # for files and directories
	import io # for bytes
	import fitz #PyMuPDF
	from PIL import Image #Pillow

	for root, dirs, files in os.walk("."):
	for filename in files:
	if filename.endswith('.pdf'):
	file = os.path.join(root, filename)
	pdf_file = fitz.open(file)
	for i in range(len(pdf_file)):
	page = pdf_file[i]
	image_list = page.get_images()
	for image_index, img in enumerate(image_list, start=1):
	xref = img[0] # get image XREF
	base_image = pdf_file.extract_image(xref)
	image_bytes = base_image["image"] # extract image bytes
	image_ext = base_image["ext"] # get image extension
	image = Image.open(io.BytesIO(image_bytes)) # load image bytes to PIL
	image_filename = filename.split('.')[0] + '_' + str(i) + '_' + str(image_index) + '.' + image_ext
	image.save(image_filename, image_ext)