ChrisBeaumont/scrape.py

## scrape.py
import requests
from soupy import Soupy, Q

URL = "https://sites.google.com/site/wheeloffortunepuzzlecompendium/home/compendium/season-%i-compendium"


def scrape():

    for i in range(1, 31):
        dom = Soupy(requests.get(URL % i).text, 'html5')
        data = (
            dom
            .find('td', 'sites-tile-name-content-1')
            .find('tbody')
            .find_all('tr')
            .each(Q.find_all('td').each(Q.text))[1:]
            .val()
        )
        yield from ((puzzle, category) for puzzle, category, _, _ in data)


if __name__ == "__main__":

    from more_itertools import take
    print(list(take(5, scrape())))
	import requests
	from soupy import Soupy, Q

	URL = "https://sites.google.com/site/wheeloffortunepuzzlecompendium/home/compendium/season-%i-compendium"


	def scrape():

	for i in range(1, 31):
	dom = Soupy(requests.get(URL % i).text, 'html5')
	data = (
	dom
	.find('td', 'sites-tile-name-content-1')
	.find('tbody')
	.find_all('tr')
	.each(Q.find_all('td').each(Q.text))[1:]
	.val()
	)
	yield from ((puzzle, category) for puzzle, category, _, _ in data)


	if __name__ == "__main__":

	from more_itertools import take
	print(list(take(5, scrape())))