mattparlane/r2_backup.rb

## r2_backup.rb
#!/usr/bin/env ruby

require 'aws-sdk-core'
require 'aws-sdk-s3'
require 'digest'

date = Date.today.strftime('%Y-%m-%d')

client = Aws::S3::Client.new(
  access_key_id: 'XXXXXX',
  secret_access_key: 'XXXXXX',
  endpoint: 'https://XXXXXX.r2.cloudflarestorage.com/',
  region: 'auto',
)

client.list_buckets.buckets.each do |bucket|
  queue = Queue.new

  client.list_objects(bucket: bucket.name).each do |response|
    response.contents.each do |object|
      queue << [bucket.name, object]
    rescue => e
      p e
      sleep 5
      retry
    end
  rescue => e
    p e
    sleep 5
    retry
  end

  threads = []

  8.times do
    threads << Thread.new do
      while !queue.empty? do
        begin
          bucket_name, object = queue.pop

          path = "r2-backups/#{date}/#{bucket_name}"
          FileUtils.mkdir_p(path)

          file_path = "#{path}/#{object.key}"

          if File.exist? file_path
            md5 = Digest::MD5.hexdigest(File.read(file_path))
            etag = object.etag.gsub(/"/, '') # For some reason the etags are double-quoted
            next if etag == md5
          end

          puts "#{bucket_name}/#{object.key}"

          real_object = client.get_object(bucket: bucket_name, key: object.key)
          body = real_object.body.read

          IO.write(file_path, body)
        rescue => e
          p e
          sleep 5
          retry
        end
      end
    end
  end

  threads.each(&:join)
end
	#!/usr/bin/env ruby

	require 'aws-sdk-core'
	require 'aws-sdk-s3'
	require 'digest'

	date = Date.today.strftime('%Y-%m-%d')

	client = Aws::S3::Client.new(
	access_key_id: 'XXXXXX',
	secret_access_key: 'XXXXXX',
	endpoint: 'https://XXXXXX.r2.cloudflarestorage.com/',
	region: 'auto',
	)

	client.list_buckets.buckets.each do \|bucket\|
	queue = Queue.new

	client.list_objects(bucket: bucket.name).each do \|response\|
	response.contents.each do \|object\|
	queue << [bucket.name, object]
	rescue => e
	p e
	sleep 5
	retry
	end
	rescue => e
	p e
	sleep 5
	retry
	end

	threads = []

	8.times do
	threads << Thread.new do
	while !queue.empty? do
	begin
	bucket_name, object = queue.pop

	path = "r2-backups/#{date}/#{bucket_name}"
	FileUtils.mkdir_p(path)

	file_path = "#{path}/#{object.key}"

	if File.exist? file_path
	md5 = Digest::MD5.hexdigest(File.read(file_path))
	etag = object.etag.gsub(/"/, '') # For some reason the etags are double-quoted
	next if etag == md5
	end

	puts "#{bucket_name}/#{object.key}"

	real_object = client.get_object(bucket: bucket_name, key: object.key)
	body = real_object.body.read

	IO.write(file_path, body)
	rescue => e
	p e
	sleep 5
	retry
	end
	end
	end
	end

	threads.each(&:join)
	end