longlostnick/page_scraper.py

## page_scraper.py
import io
import urllib.request

opener = urllib.request.FancyURLopener({})
pages_to_scrape = []

file = open("/Users/<user>/Downloads/random_slugs.txt", "r")
pages_to_scrape = file.readlines()

for url in pages_to_scrape:
    print(url)
    slug = url.split('/')[-1].strip()
    f = opener.open(url)

    with io.open("/Users/<user>/Downloads/scraped/{0}.html".format(slug), 'w', encoding='utf8') as file:
        file.write(f.read().decode('utf8'))
	import io
	import urllib.request

	opener = urllib.request.FancyURLopener({})
	pages_to_scrape = []

	file = open("/Users/<user>/Downloads/random_slugs.txt", "r")
	pages_to_scrape = file.readlines()

	for url in pages_to_scrape:
	print(url)
	slug = url.split('/')[-1].strip()
	f = opener.open(url)

	with io.open("/Users/<user>/Downloads/scraped/{0}.html".format(slug), 'w', encoding='utf8') as file:
	file.write(f.read().decode('utf8'))