ismailsimsek/spark_concurrent_upload_to_same_destination.md

## spark_concurrent_upload_to_same_destination.md

      
    Raw
  

              spark_concurrent_upload_to_same_destination.md
            
          
    Following custom file commiter, enables concurently spark processes to save data to same destination.
for each spark execution/process provide different pending.dir
# enable 
spark.sql.parquet.output.committer.class=io.debezium.server.batch.spark.ParquetOutputCommitterV2
# provide custom pending.dir
mapreduce.fileoutputcommitter.pending.dir=_temporary
mapreduce.fileoutputcommitter.pending.dir=_temporary2
mapreduce.fileoutputcommitter.pending.dir=_temporary3


FileOutputCommitterV2.java
ParquetOutputCommitterV2.java