ThibaudLamothe/wca_table_spider.py

## wca_table_spider.py
class WcaSpider(scrapy.Spider):
  name            = 'wca'
  start_urls      = ['https://www.worldcubeassociation.org/persons/2012LAMO01']
  allowed_domains = ['worldcubeassociation.org']

  def parse(self, response):

    # Identify all rows from the desired table
    rows = response.css('div.results-by-event table tbody.event-333 tr.result')

    # Fore each row yield an item
    for row in rows:
      competition = row.css('td.competition a::text').extract()
      competition = None if len(competition) == 0 else competition[0]
      yield {
        'single'      : row.css('td.single::text').extract_first().strip(),
        'avg'         : row.css('td.average::text').extract_first().strip(),
        'round'       : row.css('td.round ::text').extract_first(),
        'competition' : competition,
      }
	class WcaSpider(scrapy.Spider):
	name = 'wca'
	start_urls = ['https://www.worldcubeassociation.org/persons/2012LAMO01']
	allowed_domains = ['worldcubeassociation.org']

	def parse(self, response):

	# Identify all rows from the desired table
	rows = response.css('div.results-by-event table tbody.event-333 tr.result')

	# Fore each row yield an item
	for row in rows:
	competition = row.css('td.competition a::text').extract()
	competition = None if len(competition) == 0 else competition[0]
	yield {
	'single' : row.css('td.single::text').extract_first().strip(),
	'avg' : row.css('td.average::text').extract_first().strip(),
	'round' : row.css('td.round ::text').extract_first(),
	'competition' : competition,
	}