s4yed/SpringerBooks.py

## SpringerBooks.py
'''
 *-------------------------------------------------------------
 *  Copyright (c) Ahmed Sayed. All rights reserved.
 *  Licensed under the MIT License.
 *  Title: SpringerBooks.py
 *  Date: 2020-05-01 11:33:21
 *-------------------------------------------------------------

Excute the following commands to install the dependencies before running the script:

pip install beautifulsoup4
pip install requests
'''
from bs4 import BeautifulSoup
import requests
import os

GREEN = '\33[32m'
YELLOW = '\33[33m'

url = 'https://techgrabyte.com/springer-released-65-machine-learning-data-science-books-free/'
springer_url = 'https://link.springer.com/'
dir_name = 'Machine Learning and Data Science Books'

def find_links(url, text='', title=False):
    req = requests.get(url)
    soup = BeautifulSoup(req.text, "html.parser")
    links = set()
    for link in soup.find_all('a'):
        href = link.get('href')
        if text in href:
            if title:
                links.add((href,soup.title.string.replace(' | SpringerLink','').strip()))
            else:
                links.add(href)
    return links

springer_links = find_links(url, 'link.springer')
books = []
print(YELLOW + '[!] Getting all links ...')

for link in springer_links:
    isbn = link.split('isbn=')[-1]
    book = find_links(link, isbn+'.pdf', True)
    if book:
        books.append(book)

print(GREEN + '[+] Done')
os.mkdir(dir_name)

for book in books:
    book_name = list(book)[0][1]
    book_link = list(book)[0][0]
    print(YELLOW + f'[!] Fetching {book_name} book ...')
    req = requests.get(springer_url+book_link, stream=True)
    book_name = book_name.replace(' ','-')
    with open(f'{dir_name}/{book_name}.pdf', 'wb') as f:
        f.write(req.raw.read())

print(GREEN + '[+] Done')
	'''
	*-------------------------------------------------------------
	* Copyright (c) Ahmed Sayed. All rights reserved.
	* Licensed under the MIT License.
	* Title: SpringerBooks.py
	* Date: 2020-05-01 11:33:21
	*-------------------------------------------------------------

	Excute the following commands to install the dependencies before running the script:

	pip install beautifulsoup4
	pip install requests
	'''
	from bs4 import BeautifulSoup
	import requests
	import os

	GREEN = '\33[32m'
	YELLOW = '\33[33m'

	url = 'https://techgrabyte.com/springer-released-65-machine-learning-data-science-books-free/'
	springer_url = 'https://link.springer.com/'
	dir_name = 'Machine Learning and Data Science Books'

	def find_links(url, text='', title=False):
	req = requests.get(url)
	soup = BeautifulSoup(req.text, "html.parser")
	links = set()
	for link in soup.find_all('a'):
	href = link.get('href')
	if text in href:
	if title:
	links.add((href,soup.title.string.replace(' \| SpringerLink','').strip()))
	else:
	links.add(href)
	return links

	springer_links = find_links(url, 'link.springer')
	books = []
	print(YELLOW + '[!] Getting all links ...')

	for link in springer_links:
	isbn = link.split('isbn=')[-1]
	book = find_links(link, isbn+'.pdf', True)
	if book:
	books.append(book)

	print(GREEN + '[+] Done')
	os.mkdir(dir_name)

	for book in books:
	book_name = list(book)[0][1]
	book_link = list(book)[0][0]
	print(YELLOW + f'[!] Fetching {book_name} book ...')
	req = requests.get(springer_url+book_link, stream=True)
	book_name = book_name.replace(' ','-')
	with open(f'{dir_name}/{book_name}.pdf', 'wb') as f:
	f.write(req.raw.read())

	print(GREEN + '[+] Done')