snoremac/emr-examples-distcp.sh

## emr-examples-distcp.sh
# Bulk copy a crawl segment from S3 to the running cluster.

elastic-mapreduce -j j-2XP9O9IRLHHBU \
  --jar /home/hadoop/lib/emr-s3distcp-1.0.jar \
  --arg --src --arg s3://aws-publicdatasets/common-crawl/parse-output/segment/1346823845675 \
  --arg --srcPattern --arg '.*textData.*' \
  --arg --dest --arg hdfs:///common-crawl/parse-output/segment/1346823845675
	# Bulk copy a crawl segment from S3 to the running cluster.

	elastic-mapreduce -j j-2XP9O9IRLHHBU \
	--jar /home/hadoop/lib/emr-s3distcp-1.0.jar \
	--arg --src --arg s3://aws-publicdatasets/common-crawl/parse-output/segment/1346823845675 \
	--arg --srcPattern --arg '.textData.' \
	--arg --dest --arg hdfs:///common-crawl/parse-output/segment/1346823845675