RichLogan/no_dupes.py

## no_dupes.py
import csv
import sys

column = input("Which column do you want to test on? (Starting from 0): ")
delimiter = raw_input("How if your file deliminated? ")
duplicate_count = 0

with open(sys.argv[1], 'r') as input_file, open(sys.argv[1].split('.')[0] + "_fixed.csv", 'w') as output_file:
    seen = set()
    for line in input_file.readlines():
        row = line.split(delimiter)
        if row[column] not in seen:
            output_file.write(line)
            seen.add(row[column])
        else:
            duplicate_count += 1

print "Found " + str(duplicate_count) + " duplicate rows"
print "Output file at: " + sys.argv[1].split('.')[0] + "_fixed.csv"
	import csv
	import sys

	column = input("Which column do you want to test on? (Starting from 0): ")
	delimiter = raw_input("How if your file deliminated? ")
	duplicate_count = 0

	with open(sys.argv[1], 'r') as input_file, open(sys.argv[1].split('.')[0] + "_fixed.csv", 'w') as output_file:
	seen = set()
	for line in input_file.readlines():
	row = line.split(delimiter)
	if row[column] not in seen:
	output_file.write(line)
	seen.add(row[column])
	else:
	duplicate_count += 1

	print "Found " + str(duplicate_count) + " duplicate rows"
	print "Output file at: " + sys.argv[1].split('.')[0] + "_fixed.csv"