ITler/download-springer.sh

## download-springer.sh
#! /bin/bash

# Input file should be based on downloadable Excel sheets, but saved as CSV file (field_delimiter=; string_delimiter=<empty>)
INPUT_FILE=${1}
INPUT_FILE_CONTENT_START_LINE=${2:-2}
URL_COLUMN_IDX=${3:-19}

assemble_download_file_basename() {
    input_file="${1}"
    url="${2}"

    line=$(grep "${url}" ${input_file})
    raw=$(echo "${line}" | awk -F';' '{print $9"folderseparator"$1 " (" $2 ") [" $3 "]"}')
    echo "${raw}" | sed 's,/,-,g;s,folderseparator,/,'
}

download_epub() {
    url=${1}
    file_name="${2}.epub"
    download_folder=downloaded_epubs

    mkdir -p ${download_folder}/$(dirname "${file_name}") >/dev/null 2>&1 || true
    curl -sL -o "${download_folder}/${file_name}" $(parse_epub_url ${url})
}

parse_epub_url() {
    url=${1}

    echo $(curl -Ls -o /dev/null -w %{url_effective} "${url}" | sed -E 's,/book,/download/epub,;s/$/.epub/')
}

parse_download_links() {
    input_file="${1}"
    input_file_content_start_line="${2}"
    url_column_index="${3}"

    tail -n +${input_file_content_start_line} "${input_file}" | awk -F';' "{print \$${url_column_index}}"
}

main() {
    for url in $(parse_download_links "${1}" "${2}" "${3}"); do
        filename=$(assemble_download_file_basename "${1}" ${url})
        echo Downloading: "${filename}"

        download_epub "${url}" "${filename}"
    done
}


${__SOURCED__:+return} # to not run code after this line during shellspec tests

main "${INPUT_FILE}" "${INPUT_FILE_CONTENT_START_LINE}" "${URL_COLUMN_IDX}"
	#! /bin/bash

	# Input file should be based on downloadable Excel sheets, but saved as CSV file (field_delimiter=; string_delimiter=<empty>)
	INPUT_FILE=${1}
	INPUT_FILE_CONTENT_START_LINE=${2:-2}
	URL_COLUMN_IDX=${3:-19}

	assemble_download_file_basename() {
	input_file="${1}"
	url="${2}"

	line=$(grep "${url}" ${input_file})
	raw=$(echo "${line}" \| awk -F';' '{print $9"folderseparator"$1 " (" $2 ") [" $3 "]"}')
	echo "${raw}" \| sed 's,/,-,g;s,folderseparator,/,'
	}

	download_epub() {
	url=${1}
	file_name="${2}.epub"
	download_folder=downloaded_epubs

	mkdir -p ${download_folder}/$(dirname "${file_name}") >/dev/null 2>&1 \|\| true
	curl -sL -o "${download_folder}/${file_name}" $(parse_epub_url ${url})
	}

	parse_epub_url() {
	url=${1}

	echo $(curl -Ls -o /dev/null -w %{url_effective} "${url}" \| sed -E 's,/book,/download/epub,;s/$/.epub/')
	}

	parse_download_links() {
	input_file="${1}"
	input_file_content_start_line="${2}"
	url_column_index="${3}"

	tail -n +${input_file_content_start_line} "${input_file}" \| awk -F';' "{print \$${url_column_index}}"
	}

	main() {
	for url in $(parse_download_links "${1}" "${2}" "${3}"); do
	filename=$(assemble_download_file_basename "${1}" ${url})
	echo Downloading: "${filename}"

	download_epub "${url}" "${filename}"
	done
	}


	${__SOURCED__:+return} # to not run code after this line during shellspec tests

	main "${INPUT_FILE}" "${INPUT_FILE_CONTENT_START_LINE}" "${URL_COLUMN_IDX}"