gigafide/basic_web_scraping.py

## basic_web_scraping.py
#IMPORT LIBRARIES
from bs4 import BeautifulSoup
import requests

#REQUEST WEBPAGE AND STORE IT AS A VARIABLE
page_to_scrape = requests.get("http://quotes.toscrape.com")

#USE BEAUTIFULSOUP TO PARSE THE HTML AND STORE IT AS A VARIABLE
soup = BeautifulSoup(page_to_scrape.text, 'html.parser')

#FIND ALL THE ITEMS IN THE PAGE WITH A CLASS ATTRIBUTE OF 'TEXT'
#AND STORE THE LIST AS A VARIABLE
quotes = soup.findAll('span', attrs={'class':'text'})

#FIND ALL THE ITEMS IN THE PAGE WITH A CLASS ATTRIBUTE OF 'AUTHOR'
#AND STORE THE LIST AS A VARIABLE
authors = soup.findAll('small', attrs={"class":"author"})

#LOOP THROUGH BOTH LISTS USING THE 'ZIP' FUNCTION
#AND PRINT AND FORMAT THE RESULTS
for quote, author in zip(quotes, authors):
    print(quote.text + "-" + author.text)
	#IMPORT LIBRARIES
	from bs4 import BeautifulSoup
	import requests

	#REQUEST WEBPAGE AND STORE IT AS A VARIABLE
	page_to_scrape = requests.get("http://quotes.toscrape.com")

	#USE BEAUTIFULSOUP TO PARSE THE HTML AND STORE IT AS A VARIABLE
	soup = BeautifulSoup(page_to_scrape.text, 'html.parser')

	#FIND ALL THE ITEMS IN THE PAGE WITH A CLASS ATTRIBUTE OF 'TEXT'
	#AND STORE THE LIST AS A VARIABLE
	quotes = soup.findAll('span', attrs={'class':'text'})

	#FIND ALL THE ITEMS IN THE PAGE WITH A CLASS ATTRIBUTE OF 'AUTHOR'
	#AND STORE THE LIST AS A VARIABLE
	authors = soup.findAll('small', attrs={"class":"author"})

	#LOOP THROUGH BOTH LISTS USING THE 'ZIP' FUNCTION
	#AND PRINT AND FORMAT THE RESULTS
	for quote, author in zip(quotes, authors):
	print(quote.text + "-" + author.text)