hussainsultan/dask to_csv example.py

## dask to_csv example.py
import pandas as pd ; import numpy as np; import dask.dataframe as dd; from sklearn.datasets import load_boston

df = dd.from_pandas(pd.DataFrame(load_boston().data),npartitions=10)

def operation(df):
   df['new'] = df[0]
   return df[['new']]


df.pipe(operation).to_csv('boston*.csv')

Out:
['boston0.csv',
 'boston1.csv',
 'boston2.csv',
 'boston3.csv',
 'boston4.csv',
 'boston5.csv',
 'boston6.csv',
 'boston7.csv',
 'boston8.csv',
 'boston9.csv']

In [5]: ls
boston0.csv  boston1.csv  boston2.csv  boston3.csv  boston4.csv  boston5.csv  boston6.csv  boston7.csv  boston8.csv  boston9.csv
	import pandas as pd ; import numpy as np; import dask.dataframe as dd; from sklearn.datasets import load_boston

	df = dd.from_pandas(pd.DataFrame(load_boston().data),npartitions=10)

	def operation(df):
	df['new'] = df[0]
	return df[['new']]


	df.pipe(operation).to_csv('boston*.csv')

	Out:
	['boston0.csv',
	'boston1.csv',
	'boston2.csv',
	'boston3.csv',
	'boston4.csv',
	'boston5.csv',
	'boston6.csv',
	'boston7.csv',
	'boston8.csv',
	'boston9.csv']

	In [5]: ls
	boston0.csv boston1.csv boston2.csv boston3.csv boston4.csv boston5.csv boston6.csv boston7.csv boston8.csv boston9.csv