rafikahmed/spider.py

## spider.py
class MySpider(scrapy.Spider):
  name = 'example'

  current_page = 1

  script = '''
    function main(splash, args)
      splash.private_mode_enabled = false
      url = args.url
      assert(splash:go(url))
      assert(splash:wait(1))
      assert(splash:run_js(args.js_source))
      assert(splash:wait(1))
      return splash:html()
    end
  '''

  def start_requests(self):
    # initial request


  def parse(self, response):
    # parse your data
    #pagination
    if self.current_page <= 5:
      self.current_page += 1
      js_source = f"javascript:__doPostBack('ctl00$MainContent$gvReport','Page${self.current_page}')"
      yield SplashRequest(url='YOUR_URL', callback=self.parse, endpoint='execute', args={'lua_source': self.script, 'js_source':js_source}, dont_filter=True)

## splash.lua
function main(splash, args)
  splash.private_mode_enabled = false
  url = args.url
  assert(splash:go(url))
  assert(splash:wait(1))
  assert(splash:run_js(args.js_source))
  assert(splash:wait(1))
  return splash:html()
end
	class MySpider(scrapy.Spider):
	name = 'example'

	current_page = 1

	script = '''
	function main(splash, args)
	splash.private_mode_enabled = false
	url = args.url
	assert(splash:go(url))
	assert(splash:wait(1))
	assert(splash:run_js(args.js_source))
	assert(splash:wait(1))
	return splash:html()
	end
	'''

	def start_requests(self):
	# initial request


	def parse(self, response):
	# parse your data
	#pagination
	if self.current_page <= 5:
	self.current_page += 1
	js_source = f"javascript:__doPostBack('ctl00$MainContent$gvReport','Page${self.current_page}')"
	yield SplashRequest(url='YOUR_URL', callback=self.parse, endpoint='execute', args={'lua_source': self.script, 'js_source':js_source}, dont_filter=True)