nickrobson/euref.py

## euref.py
#!/usr/bin/env python

import re
import urllib2
import bs4

BASE_URL = 'http://www.bbc.co.uk/news/politics/eu_referendum/results/local/'
VOTES = re.compile(r'[0-9]+(?:,[0-9]+)*')

def get_urls():
    return [BASE_URL + chr(x) for x in range(97, 123)]

for url in get_urls():
    try:
        content = urllib2.urlopen(url).read()
        soup = bs4.BeautifulSoup(content, 'html.parser')
        results = soup.find_all('div', class_='eu-ref-result-bar')
        for result in results:
            name = result.find('h3').get_text()
            leave = result.find('div', class_='eu-ref-result-bar__party--leave')
            remain = result.find('div', class_='eu-ref-result-bar__party--remain')
            lvotes = leave.find('div', class_='eu-ref-result-bar__votes').get_text().strip()
            rvotes = remain.find('div', class_='eu-ref-result-bar__votes').get_text().strip()
            lv = VOTES.search(lvotes)
            if lv:
                lvotes = lv.group(0)
            rv = VOTES.search(rvotes)
            if rv:
                rvotes = rv.group(0)
            print name.strip(), '|', lvotes, '|', rvotes
    except urllib2.HTTPError:
        pass
	#!/usr/bin/env python

	import re
	import urllib2
	import bs4

	BASE_URL = 'http://www.bbc.co.uk/news/politics/eu_referendum/results/local/'
	VOTES = re.compile(r'[0-9]+(?:,[0-9]+)*')

	def get_urls():
	return [BASE_URL + chr(x) for x in range(97, 123)]

	for url in get_urls():
	try:
	content = urllib2.urlopen(url).read()
	soup = bs4.BeautifulSoup(content, 'html.parser')
	results = soup.find_all('div', class_='eu-ref-result-bar')
	for result in results:
	name = result.find('h3').get_text()
	leave = result.find('div', class_='eu-ref-result-bar__party--leave')
	remain = result.find('div', class_='eu-ref-result-bar__party--remain')
	lvotes = leave.find('div', class_='eu-ref-result-bar__votes').get_text().strip()
	rvotes = remain.find('div', class_='eu-ref-result-bar__votes').get_text().strip()
	lv = VOTES.search(lvotes)
	if lv:
	lvotes = lv.group(0)
	rv = VOTES.search(rvotes)
	if rv:
	rvotes = rv.group(0)
	print name.strip(), '\|', lvotes, '\|', rvotes
	except urllib2.HTTPError:
	pass