patrickvossler18/WSJ_home_adv.py

## WSJ_home_adv.py
from selenium import webdriver
import csv
from bs4 import BeautifulSoup
from selenium.webdriver.common.action_chains import ActionChains
import time

pred_SoS = "SoS.csv"
pred_SoS_headers= ["Rank", "Team", "Conference", "SoS"]
i = 1

def getrows():
	html = driver.page_source
	soup = BeautifulSoup(html, "lxml")
	table = soup.find("table")
	#print table
	for trs in table.find_all('tr'):
		tds = trs.find_all('td')
		row = [elem.text.strip().encode('utf-8') for elem in tds]
		print row
		writer.writerow(row)

def nextpage():
	value = "Next"
	span_xpath = '//a[contains(text(), "' + value + '")]'
	elem = driver.find_element_by_xpath(span_xpath)
	elem.click()

with open(pred_SoS, 'wb+') as csv_file:
    writer = csv.DictWriter(csv_file, fieldnames = pred_SoS_headers, delimiter = ',')
    writer.writeheader()
    writer = csv.writer(csv_file)
    driver = webdriver.Chrome()
    driver.get("http://graphics.wsj.com/table/COUNT0903?embed=1")
    # time.sleep(5)

    while i < 14:

		getrows()
		nextpage()
		i += 1
driver.close()
	from selenium import webdriver
	import csv
	from bs4 import BeautifulSoup
	from selenium.webdriver.common.action_chains import ActionChains
	import time

	pred_SoS = "SoS.csv"
	pred_SoS_headers= ["Rank", "Team", "Conference", "SoS"]
	i = 1

	def getrows():
	html = driver.page_source
	soup = BeautifulSoup(html, "lxml")
	table = soup.find("table")
	#print table
	for trs in table.find_all('tr'):
	tds = trs.find_all('td')
	row = [elem.text.strip().encode('utf-8') for elem in tds]
	print row
	writer.writerow(row)

	def nextpage():
	value = "Next"
	span_xpath = '//a[contains(text(), "' + value + '")]'
	elem = driver.find_element_by_xpath(span_xpath)
	elem.click()

	with open(pred_SoS, 'wb+') as csv_file:
	writer = csv.DictWriter(csv_file, fieldnames = pred_SoS_headers, delimiter = ',')
	writer.writeheader()
	writer = csv.writer(csv_file)
	driver = webdriver.Chrome()
	driver.get("http://graphics.wsj.com/table/COUNT0903?embed=1")
	# time.sleep(5)

	while i < 14:

	getrows()
	nextpage()
	i += 1
	driver.close()