ashaegupta/terminals_webscraper.py

## terminals_webscraper.py
import urllib2
from BeautifulSoup import BeautifulSoup

class Terminals():
    def __init__(self):
        self.terminals = {}
        self.airports = ["jfk", "ewr", "lga"]
        self.getAllTerminals()

    def getAllTerminals(self):
        for airport in self.airports:
            self.terminals[airport] = {}
            terms = {}
            terms = self.getTerminals(airport)
            self.terminals[airport] = terms
        print self.terminals

    def getTerminals(self, airport=str):
        terms = {}
        airport_html = "http://www.panynj.gov/airports/" + airport + "-airlines.html"
        soup = BeautifulSoup(urllib2.urlopen(airport_html).read())
        for row in soup('table')[0].tbody('tr'):
            tds = row('td')
            airline = tds[0].a.string
            arrival_terminal = tds[4].string
            terms[airline] = arrival_terminal
        return terms
	import urllib2
	from BeautifulSoup import BeautifulSoup

	class Terminals():
	def __init__(self):
	self.terminals = {}
	self.airports = ["jfk", "ewr", "lga"]
	self.getAllTerminals()

	def getAllTerminals(self):
	for airport in self.airports:
	self.terminals[airport] = {}
	terms = {}
	terms = self.getTerminals(airport)
	self.terminals[airport] = terms
	print self.terminals

	def getTerminals(self, airport=str):
	terms = {}
	airport_html = "http://www.panynj.gov/airports/" + airport + "-airlines.html"
	soup = BeautifulSoup(urllib2.urlopen(airport_html).read())
	for row in soup('table')[0].tbody('tr'):
	tds = row('td')
	airline = tds[0].a.string
	arrival_terminal = tds[4].string
	terms[airline] = arrival_terminal
	return terms