XIT07/redbubble_sitemap.py

## redbubble_sitemap.py
#Scrape Redbubble's sitemap to get the most popular searches etc..
#XIT07
#Python
import requests, csv
from bs4 import BeautifulSoup
from datetime import datetime
today = datetime.now()
url = 'https://www.redbubble.com/sitemap/new_works_00001.xml'
def datas(url):
    r = requests.get(url)
    soup = BeautifulSoup(r.text, 'lxml')
    data = soup.find_all('url')
    return {i.find('loc').text: i.find('lastmod').text if i.find('lastmod') else None for i in data}
data = datas(url)
with open(today.strftime('%h_%Y-%m-%d_%H-%M-%S')+'.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(['url', 'lastmod'])
    for i in data:
        info = {'url': i, 'lastmod': data[i]}
        print(f'parsing {info}')
        writer.writerow(list(info.values()))
	#Scrape Redbubble's sitemap to get the most popular searches etc..
	#XIT07
	#Python
	import requests, csv
	from bs4 import BeautifulSoup
	from datetime import datetime
	today = datetime.now()
	url = 'https://www.redbubble.com/sitemap/new_works_00001.xml'
	def datas(url):
	r = requests.get(url)
	soup = BeautifulSoup(r.text, 'lxml')
	data = soup.find_all('url')
	return {i.find('loc').text: i.find('lastmod').text if i.find('lastmod') else None for i in data}
	data = datas(url)
	with open(today.strftime('%h_%Y-%m-%d_%H-%M-%S')+'.csv', 'w', newline='', encoding='utf-8') as file:
	writer = csv.writer(file)
	writer.writerow(['url', 'lastmod'])
	for i in data:
	info = {'url': i, 'lastmod': data[i]}
	print(f'parsing {info}')
	writer.writerow(list(info.values()))