thbar/import_multiple_csv_to_database.rb

## import_multiple_csv_to_database.rb
# https://www.kiba-etl.org

# for source
require 'kiba-common/sources/enumerable'
require 'kiba-common/sources/csv'

# to create 1 source out of each input file
require 'kiba-common/transforms/source_adapter'

# for target - Kiba Pro is the commercial extension
# more information at https://github.com/thbar/kiba/wiki
require 'kiba-pro/destinations/sql_bulk_insert'
require 'sequel'
require 'pg'

# for file clean-up
require 'fileutils'

Sequel.connect(ENV.fetch('DATABASE_URL')) do |db|
  processed_files = []
  job = Kiba.parse do
    source Kiba::Common::Sources::Enumerable, -> { Dir["input/*.csv"] }

    transform do |file|
      processed_files << file # keep a trace to move at the end
      [
        Kiba::Common::Sources::CSV,
        filename: file,
        csv_options: { headers: true }
      ]
    end

    # NOTE: this takes each row as a new source, and instantiate it
    transform Kiba::Common::Transforms::SourceTransformAdapter

    # NOTE: here you would transform the columns, remap value etc if needed

    destination Kiba::Pro::Destinations::SQLBulkInsert,
      database: db,
      table: :products,
      # if we need to upsert rather than insert
      dataset: -> (dataset) {
        dataset.insert_conflict(target: :some_unique_key)
      },
      buffer_size: 20_000

    post_process do
      logger = Logger.new(STDOUT)
      processed_files.each do |file|
        logger.info "Moving file #{file} to processed..."
        FileUtils.mv(file, 'processed')
      end
    end
  end

  Kiba.run(job)
end
	# https://www.kiba-etl.org

	# for source
	require 'kiba-common/sources/enumerable'
	require 'kiba-common/sources/csv'

	# to create 1 source out of each input file
	require 'kiba-common/transforms/source_adapter'

	# for target - Kiba Pro is the commercial extension
	# more information at https://github.com/thbar/kiba/wiki
	require 'kiba-pro/destinations/sql_bulk_insert'
	require 'sequel'
	require 'pg'

	# for file clean-up
	require 'fileutils'

	Sequel.connect(ENV.fetch('DATABASE_URL')) do \|db\|
	processed_files = []
	job = Kiba.parse do
	source Kiba::Common::Sources::Enumerable, -> { Dir["input/*.csv"] }

	transform do \|file\|
	processed_files << file # keep a trace to move at the end
	[
	Kiba::Common::Sources::CSV,
	filename: file,
	csv_options: { headers: true }
	]
	end

	# NOTE: this takes each row as a new source, and instantiate it
	transform Kiba::Common::Transforms::SourceTransformAdapter

	# NOTE: here you would transform the columns, remap value etc if needed

	destination Kiba::Pro::Destinations::SQLBulkInsert,
	database: db,
	table: :products,
	# if we need to upsert rather than insert
	dataset: -> (dataset) {
	dataset.insert_conflict(target: :some_unique_key)
	},
	buffer_size: 20_000

	post_process do
	logger = Logger.new(STDOUT)
	processed_files.each do \|file\|
	logger.info "Moving file #{file} to processed..."
	FileUtils.mv(file, 'processed')
	end
	end
	end

	Kiba.run(job)
	end