siddhantkushwaha/custom_crawl.py

## custom_crawl.py
from scrapy.crawler import CrawlerProcess
from scrapy_tasks.spiders.trial import *


class CustomCrawler:

    def __init__(self):
        self.output = None
        self.process = CrawlerProcess(settings={'LOG_ENABLED': False})

    def yield_output(self, data):
        self.output = data

    def crawl(self, cls):
        self.process.crawl(cls, args={'callback': self.yield_output})
        self.process.start()


def crawl_static(cls):
    crawler = CustomCrawler()
    crawler.crawl(cls)
    return crawler.output


if __name__ == '__main__':
    out = crawl_static(Trial)
    print(out)

## spider.py
from scrapy import Spider


class Trial(Spider):
    name = 'trial'

    start_urls = ['']

    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        self.output_callback = kwargs.get('args').get('callback')

    def parse(self, response):
        pass

    def close(self, spider, reason):
        self.output_callback(['Hi, This is the output.'])
	from scrapy.crawler import CrawlerProcess
	from scrapy_tasks.spiders.trial import *


	class CustomCrawler:

	def __init__(self):
	self.output = None
	self.process = CrawlerProcess(settings={'LOG_ENABLED': False})

	def yield_output(self, data):
	self.output = data

	def crawl(self, cls):
	self.process.crawl(cls, args={'callback': self.yield_output})
	self.process.start()


	def crawl_static(cls):
	crawler = CustomCrawler()
	crawler.crawl(cls)
	return crawler.output


	if __name__ == '__main__':
	out = crawl_static(Trial)
	print(out)
	from scrapy import Spider


	class Trial(Spider):
	name = 'trial'

	start_urls = ['']

	def __init__(self, **kwargs):
	super().__init__(**kwargs)
	self.output_callback = kwargs.get('args').get('callback')

	def parse(self, response):
	pass

	def close(self, spider, reason):
	self.output_callback(['Hi, This is the output.'])