alecxe/spider.py

## spider.py
from scrapy.http import Request
from scrapy.item import Item, Field
from scrapy.selector import Selector
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector


class MyItem(Item):
    reviewer_ranking = Field()


class MySpider(BaseSpider):
    name = 'myspider'
    allowed_domains = ["amazon.com"]

    def start_requests(self):
        yield Request("https://www.amazon.com/gp/pdp/profile/A28XDLTGHPIWE1/ref=cm_cr_pr_pdp",
                      headers={'User-Agent': "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"})

    def parse(self, response):
        print"fggfggftgtr"
        sel = Selector(response)
        hxs = HtmlXPathSelector(response)
        item = MyItem()
        item["reviewer_ranking"] = hxs.select('//span[@class="a-size-small a-color-secondary"]/text()').extract()
        return item
	from scrapy.http import Request
	from scrapy.item import Item, Field
	from scrapy.selector import Selector
	from scrapy.spider import BaseSpider
	from scrapy.selector import HtmlXPathSelector


	class MyItem(Item):
	reviewer_ranking = Field()


	class MySpider(BaseSpider):
	name = 'myspider'
	allowed_domains = ["amazon.com"]

	def start_requests(self):
	yield Request("https://www.amazon.com/gp/pdp/profile/A28XDLTGHPIWE1/ref=cm_cr_pr_pdp",
	headers={'User-Agent': "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"})

	def parse(self, response):
	print"fggfggftgtr"
	sel = Selector(response)
	hxs = HtmlXPathSelector(response)
	item = MyItem()
	item["reviewer_ranking"] = hxs.select('//span[@class="a-size-small a-color-secondary"]/text()').extract()
	return item