Jeremy B. Merrill jeremybmerrill

## PhotostreamJob.rb
class PhotostreamJob < BaseJob
  @queue = :photostreamphotos
end

## Resque.rake
require 'resque/tasks'
require 'resque_scheduler'
require 'resque_scheduler/tasks'
require 'resque_scheduler/server'

rails_root = ENV['RAILS_ROOT'] || File.dirname(__FILE__) + '/../..'
rails_env = ENV['RAILS_ENV'] || 'development'

resque_config = YAML.load_file(rails_root + '/config/resque.yml') #contains Redis's location on the network for different Rails environments
Resque.redis = resque_config[rails_env]

## BaseJob.rb
class BaseJob
  def self.perform()
    #Do the job.
  end
end


## astrazeneca.rb
require 'upton'

class AstraZenecaScraper < Upton::Scraper
  ROWS_PER_PAGE = 50

  def initialize(index_url_array, site_meta)
    @sleep_time_between_requests = 15
    @site_meta = site_meta
    @total_pages = @site_meta[:total_pages]
    @az_time_period_identifier = @site_meta[:az_time_period_identifier]

## count_scraper.rb
require 'upton'
require 'date'
require 'guess'

GLOBAL_VERBOSE = true

# - any lowercased pronoun is okay
# - capitalized pronouns are okay unless they're in a book title, which is a series of capitalized words;
#   that is, capitalized pronouns are okay if there are zero alphabetic characters between them and a sentence-final punct
FEMALE_REGEXES = [/ she[\.,\s!?\' ]/, / her[\.,\s!?\' ]/,

## gender.rb
require 'csv'
require 'set'

class Gender
  def initialize(options={})
    countries = Set.new([:us, :uk])

    @threshold = options[:threshold] || 0.99

    @names_counts = {}

## tabula_basic.rb
require 'tabula'

pdf_file_path = "czechmaybe.pdf"
outfilename = "czechmaybe.csv"

out = open(outfilename, 'w')

extractor = Tabula::Extraction::ObjectExtractor.new(pdf_file_path, [5] ) #:all ) # 1..2643
extractor.extract.each do |pdf_page|
  pdf_page.spreadsheets.each do |spreadsheet|

## compstat.rb
require 'tabula'
require 'fileutils'


folder_name = "compstat"
output_folder_name = "compstat_csvs"

#########################################################################
#########################################################################
FileUtils.mkdir_p(output_folder_name + "/")

## edc.rb
require 'tabula'
require 'fileutils'


folder_name = "EDC"
output_folder_name = "EDCcsvs"

#########################################################################
#########################################################################
FileUtils.mkdir_p(output_folder_name + "/")

## keybase.md

      
              1 file
            
          
              0 forks
            
          
              0 comments
            
          
              0 stars
            
          
                jeremybmerrill
                / keybase.md
            
            
              Created
              March 8, 2014 15:14
            
          
    Keybase proof

I hereby claim:

I am jeremybmerrill on github.
I am jeremybmerrill (https://keybase.io/jeremybmerrill) on keybase.
I have a public key whose fingerprint is 441A 05CC B462 AF95 45FA  95B5 CDF7 BBEF F5A7 B374

To claim this, I am signing this object:
	class PhotostreamJob < BaseJob
	@queue = :photostreamphotos
	end
	require 'resque/tasks'
	require 'resque_scheduler'
	require 'resque_scheduler/tasks'
	require 'resque_scheduler/server'

	rails_root = ENV['RAILS_ROOT'] \|\| File.dirname(__FILE__) + '/../..'
	rails_env = ENV['RAILS_ENV'] \|\| 'development'

	resque_config = YAML.load_file(rails_root + '/config/resque.yml') #contains Redis's location on the network for different Rails environments
	Resque.redis = resque_config[rails_env]
	require 'upton'

	class AstraZenecaScraper < Upton::Scraper
	ROWS_PER_PAGE = 50

	def initialize(index_url_array, site_meta)
	@sleep_time_between_requests = 15
	@site_meta = site_meta
	@total_pages = @site_meta[:total_pages]
	@az_time_period_identifier = @site_meta[:az_time_period_identifier]
	require 'upton'
	require 'date'
	require 'guess'

	GLOBAL_VERBOSE = true

	# - any lowercased pronoun is okay
	# - capitalized pronouns are okay unless they're in a book title, which is a series of capitalized words;
	# that is, capitalized pronouns are okay if there are zero alphabetic characters between them and a sentence-final punct
	FEMALE_REGEXES = [/ she[\.,\s!?\' ]/, / her[\.,\s!?\' ]/,
	require 'csv'
	require 'set'

	class Gender
	def initialize(options={})
	countries = Set.new([:us, :uk])

	@threshold = options[:threshold] \|\| 0.99

	@names_counts = {}
	require 'tabula'

	pdf_file_path = "czechmaybe.pdf"
	outfilename = "czechmaybe.csv"

	out = open(outfilename, 'w')

	extractor = Tabula::Extraction::ObjectExtractor.new(pdf_file_path, [5] ) #:all ) # 1..2643
	extractor.extract.each do \|pdf_page\|
	pdf_page.spreadsheets.each do \|spreadsheet\|
	require 'tabula'
	require 'fileutils'


	folder_name = "compstat"
	output_folder_name = "compstat_csvs"

	#########################################################################
	#########################################################################
	FileUtils.mkdir_p(output_folder_name + "/")
	require 'tabula'
	require 'fileutils'


	folder_name = "EDC"
	output_folder_name = "EDCcsvs"

	#########################################################################
	#########################################################################
	FileUtils.mkdir_p(output_folder_name + "/")