nruigrok/kamerstukken

## kamerstukken
def scrape_pb(url):
    url = URL_ROOT + url
    print(url)
    page = requests.get(url)
    tree = html.fromstring(page.text)
    medium = get_css(tree, "h1.resultheader-publicatietype")
    try:
        headline = get_css(tree, "h1.title")
    except:
        pass
    else:
        print(headline)
    times = {t.get("itemprop"): t.get("datetime") for t in tree.cssselect("time")}
    print(times)
    try:
        date = times["Datum vergadering"]
        if not date:
            date = times["DatePublished"]
            if not date:
                raise Exception ("could not get date")
        print(date)
    finally:
        date = datetime.strptime(date, "%Y-%m-%d")
    content, = tree.cssselect("div.agendapunt")
   # content_html = etree.tostring(content)
    body = content.text_content()
	def scrape_pb(url):
	url = URL_ROOT + url
	print(url)
	page = requests.get(url)
	tree = html.fromstring(page.text)
	medium = get_css(tree, "h1.resultheader-publicatietype")
	try:
	headline = get_css(tree, "h1.title")
	except:
	pass
	else:
	print(headline)
	times = {t.get("itemprop"): t.get("datetime") for t in tree.cssselect("time")}
	print(times)
	try:
	date = times["Datum vergadering"]
	if not date:
	date = times["DatePublished"]
	if not date:
	raise Exception ("could not get date")
	print(date)
	finally:
	date = datetime.strptime(date, "%Y-%m-%d")
	content, = tree.cssselect("div.agendapunt")
	# content_html = etree.tostring(content)
	body = content.text_content()