gordonje/scrape.py

## scrape.py
import requests
from time import sleep


session = requests.Session()

def cache_page(identifier):
    sleep(3)
    url = f'https://mycourts.in.gov/PORP/Search/Detail?ID={identifier}'
    r = session.get(url)
    html = r.content
    with open(f".cache/SearchDetail/{identifier}.html", 'wb') as file:
        file.write(html)
    return print(f'  Cached content from {url}')

if __name__ == "__main__":
    for identifier in range(1, 60000):
        cache_page(identifier)
	import requests
	from time import sleep


	session = requests.Session()

	def cache_page(identifier):
	sleep(3)
	url = f'https://mycourts.in.gov/PORP/Search/Detail?ID={identifier}'
	r = session.get(url)
	html = r.content
	with open(f".cache/SearchDetail/{identifier}.html", 'wb') as file:
	file.write(html)
	return print(f' Cached content from {url}')

	if __name__ == "__main__":
	for identifier in range(1, 60000):
	cache_page(identifier)