isaqueprofeta/download_springer.py

## download_springer.py
import requests
import csv
import os

# PREREQUISITOS:
# Python3.6 com bilbioteca Requests

# Script para download dos livros:
# https://www.hardmob.com.br/threads/744521-Springer-PDF-Livros-da-Editora-Springer-DE-GRACA-negocios-engenharia-medicina

# Download do CSV da lista disponibilizada
lista_livros = requests.get(
    'https://docs.google.com/spreadsheets/d/1HzdumNltTj2SHmCv3SRdoub8SvpIEn75fa4Q23x0keU/export?format=csv&id=1HzdumNltTj2SHmCv3SRdoub8SvpIEn75fa4Q23x0keU'
)

# Leitura da lista para uma variável
planilha = csv.reader(
    lista_livros.content.decode('utf-8').splitlines(),
    delimiter=','
)

# Cria uma lista de livros para remover o cabeçalho do CSV
livros = list(planilha)
livros.pop(0)

# Para cada livro da lista
for livro in livros:
    # Lendo o CSV antes de começar, o nome está na primeira posição dos dados
    nome_livro = livro[0].replace('/', '-')

    # Fazendo o download manualmente, e estudando os links da para ver
    # que o formato do link de download é = DOI%2FISBN
    doi_isbn = livro[17].split('/')[3] + '%2F' + livro[17].split('/')[4]

    # Fazendo o download manualmente, e estudando os links
    # pego a URL e junto ela com o link de download
    link_download = f'https://link.springer.com/content/pdf/{doi_isbn}'

    # Lendo o CSV antes de começar, os generos do livro estão na 20a posição
    # separados por ponto e virgula, então pego apenas o primeiro genero
    pasta_genero = f'./{livro[19].split(';')[0]}/'

    # Crio a pasta de genero se ela não existir
    if not os.path.isdir(pasta_genero):
        print(f'Criando diretório: {pasta_genero}')
        os.mkdir(pasta_genero)

    # Aviso onde estou e que vou começar o download
    print(f'Fazendo download do livro: {nome_livro} na pasta {pasta_genero}')

    # Executo do download em memória
    download = requests.get(link_download)

    # Salvo o arquivo em disco
    open(f'{pasta_genero}{nome_livro}.pdf',
         'wb').write(download.content)
	import requests
	import csv
	import os

	# PREREQUISITOS:
	# Python3.6 com bilbioteca Requests

	# Script para download dos livros:
	# https://www.hardmob.com.br/threads/744521-Springer-PDF-Livros-da-Editora-Springer-DE-GRACA-negocios-engenharia-medicina

	# Download do CSV da lista disponibilizada
	lista_livros = requests.get(
	'https://docs.google.com/spreadsheets/d/1HzdumNltTj2SHmCv3SRdoub8SvpIEn75fa4Q23x0keU/export?format=csv&id=1HzdumNltTj2SHmCv3SRdoub8SvpIEn75fa4Q23x0keU'
	)

	# Leitura da lista para uma variável
	planilha = csv.reader(
	lista_livros.content.decode('utf-8').splitlines(),
	delimiter=','
	)

	# Cria uma lista de livros para remover o cabeçalho do CSV
	livros = list(planilha)
	livros.pop(0)

	# Para cada livro da lista
	for livro in livros:
	# Lendo o CSV antes de começar, o nome está na primeira posição dos dados
	nome_livro = livro[0].replace('/', '-')

	# Fazendo o download manualmente, e estudando os links da para ver
	# que o formato do link de download é = DOI%2FISBN
	doi_isbn = livro[17].split('/')[3] + '%2F' + livro[17].split('/')[4]

	# Fazendo o download manualmente, e estudando os links
	# pego a URL e junto ela com o link de download
	link_download = f'https://link.springer.com/content/pdf/{doi_isbn}'

	# Lendo o CSV antes de começar, os generos do livro estão na 20a posição
	# separados por ponto e virgula, então pego apenas o primeiro genero
	pasta_genero = f'./{livro[19].split(';')[0]}/'

	# Crio a pasta de genero se ela não existir
	if not os.path.isdir(pasta_genero):
	print(f'Criando diretório: {pasta_genero}')
	os.mkdir(pasta_genero)

	# Aviso onde estou e que vou começar o download
	print(f'Fazendo download do livro: {nome_livro} na pasta {pasta_genero}')

	# Executo do download em memória
	download = requests.get(link_download)

	# Salvo o arquivo em disco
	open(f'{pasta_genero}{nome_livro}.pdf',
	'wb').write(download.content)