Ahmed Rafik Djerah rafikahmed

## items.py
import scrapy
from scrapy.loader.processors import MapCompose, TakeFirst
from w3lib.html import remove_tags

def remove_whitespace(value):
    return value.strip()

class JokeItem(scrapy.Item):
    joke_text= scrapy.Field(
        input_processor= MapCompose(remove_tags, remove_whitespace),

## jokes.py
import scrapy
from demo_project.items import JokeItem
from scrapy.loader import ItemLoader

class JokesSpider(scrapy.Spider):
    name= 'jokes'

    allowed_domais = ['www.laughfactory.com']

    start_urls = [

## items.py
class JokeItem(scrapy.Item):
    joke_text= scrapy.Field()

## jokes.py
next_page= response.xpath("//li[@class='next']/a/@href").extract_first()
        if next_page is not None:
            next_page_link= response.urljoin(next_page)
            yield scrapy.Request(url=next_page_link, callback=self.parse)

## jokes.py
    def parse(self, response):
        for joke in response.xpath("//div[@class='jokes']"):
            yield {
                'joke_text': joke.xpath(".//div[@class='joke-text']/p").extract_first()
            }

## jokes.py
import scrapy

class JokesSpider(scrapy.Spider):
    name= 'jokes'
    allowed_domains = ['www.laughfactory.com']
    start_urls = [
        'http://www.laughfactory.com/jokes/family-jokes'
    ]

    def parse(self, response):

## index.html
<p class='someClass'>Paragraph 1</p>
<p id='someId'>Paragraph 2</p>

## index.html
<div>
  <a href='www.example.com'>Link</a>
</div>

## index.html
<!DOCTYPE html>
<html lang="en">

<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta http-equiv="X-UA-Compatible" content="ie=edge">
    <title>Xpath Syntax</title>
</head>
	import scrapy
	from scrapy.loader.processors import MapCompose, TakeFirst
	from w3lib.html import remove_tags

	def remove_whitespace(value):
	return value.strip()

	class JokeItem(scrapy.Item):
	joke_text= scrapy.Field(
	input_processor= MapCompose(remove_tags, remove_whitespace),
	import scrapy
	from demo_project.items import JokeItem
	from scrapy.loader import ItemLoader

	class JokesSpider(scrapy.Spider):
	name= 'jokes'

	allowed_domais = ['www.laughfactory.com']

	start_urls = [
	next_page= response.xpath("//li[@class='next']/a/@href").extract_first()
	if next_page is not None:
	next_page_link= response.urljoin(next_page)
	yield scrapy.Request(url=next_page_link, callback=self.parse)
	def parse(self, response):
	for joke in response.xpath("//div[@class='jokes']"):
	yield {
	'joke_text': joke.xpath(".//div[@class='joke-text']/p").extract_first()
	}
	<p class='someClass'>Paragraph 1</p>
	<p id='someId'>Paragraph 2</p>
	<!DOCTYPE html>
	<html lang="en">

	<head>
	<meta charset="UTF-8">
	<meta name="viewport" content="width=device-width, initial-scale=1.0">
	<meta http-equiv="X-UA-Compatible" content="ie=edge">
	<title>Xpath Syntax</title>
	</head>