matabares/ejemplo.py

## ejemplo.py
import pandas as pd
import numpy as np
from tabulate import tabulate
#chunksize = 10 ** 6
#for chunk in pd.read_csv('', chunksize=chunksize):


import os
source = 'c:/borreme/isa2/'
allFrames = []
for root, dirs, filenames in os.walk(source):
    for file in filenames:
        print(file)
        df = pd.read_csv('C:/borreme/isa2/'+file, delimiter='|', names=['hotelcode', 'amenitycode', 'name', 'type'],
                         header=None)
        df.drop_duplicates(subset='amenitycode', keep='first', inplace=True)
        allFrames.append(df.copy())
        del df

print(len(allFrames))
totFrame = pd.concat(allFrames)

totFrame.drop_duplicates(subset='amenitycode', keep='first', inplace=True)

totFrame.to_csv(r'C:/borreme/isa2/result.csv')
	import pandas as pd
	import numpy as np
	from tabulate import tabulate
	#chunksize = 10 ** 6
	#for chunk in pd.read_csv('', chunksize=chunksize):



	import os
	source = 'c:/borreme/isa2/'
	allFrames = []
	for root, dirs, filenames in os.walk(source):
	for file in filenames:
	print(file)
	df = pd.read_csv('C:/borreme/isa2/'+file, delimiter='\|', names=['hotelcode', 'amenitycode', 'name', 'type'],
	header=None)
	df.drop_duplicates(subset='amenitycode', keep='first', inplace=True)
	allFrames.append(df.copy())
	del df

	print(len(allFrames))
	totFrame = pd.concat(allFrames)

	totFrame.drop_duplicates(subset='amenitycode', keep='first', inplace=True)

	totFrame.to_csv(r'C:/borreme/isa2/result.csv')