shreyansb/terminals_webscraper.py

## terminals_webscraper.py
import urllib2
from BeautifulSoup import BeautifulSoup


airport_list = ["jfk", "ewr", "lga"]

def getAllTerminals():
    terminals = {}
    for airport in airport_list:
        terms = klass._getTerminals(airport)
        terminals[airport] = terms
    return terminals

def _getTerminals(airport):
    terms = {}
    airport_html = "http://www.panynj.gov/airports/" + airport + "-airlines.html"
    data = urllib2.urlopen(airport_html).read()
    if not data:
        return
    soup = BeautifulSoup(data)
    for row in soup('table')[0].tbody('tr'):
        tds = row('td')
        airline = tds[0].a.string
        arrival_terminal = tds[4].string
        terms[airline] = arrival_terminal
    return terms

# this is how I'd call it:
resp = getAllTerminals()
# save it somewhere
	import urllib2
	from BeautifulSoup import BeautifulSoup


	airport_list = ["jfk", "ewr", "lga"]

	def getAllTerminals():
	terminals = {}
	for airport in airport_list:
	terms = klass._getTerminals(airport)
	terminals[airport] = terms
	return terminals

	def _getTerminals(airport):
	terms = {}
	airport_html = "http://www.panynj.gov/airports/" + airport + "-airlines.html"
	data = urllib2.urlopen(airport_html).read()
	if not data:
	return
	soup = BeautifulSoup(data)
	for row in soup('table')[0].tbody('tr'):
	tds = row('td')
	airline = tds[0].a.string
	arrival_terminal = tds[4].string
	terms[airline] = arrival_terminal
	return terms

	# this is how I'd call it:
	resp = getAllTerminals()
	# save it somewhere