do-me/pandarallel.py

## pandarallel.py
import pandas as pd
import numpy as np
from pandarallel import pandarallel

pandarallel.initialize(progress_bar=True)

# Create a sample dataframe with 10,000 rows and 2 columns
np.random.seed(0)  # for reproducibility
df = pd.DataFrame({'numbers': np.random.randint(1, 100, size=10000000)})

# you might need to wrap your functions if you reference from external sources
def wrap_func(n):
    return n**2

df["square_numbers"] = df["numbers"].parallel_apply(wrap_func)

df

#INFO: Pandarallel will run on 16 workers.
#INFO: Pandarallel will use standard multiprocessing data transfer (pipe) to transfer data between the main process and workers.
#numbers	square_numbers
#0	45	2025
#1	48	2304
#2	65	4225
#3	68	4624
#4	68	4624
#...	...	...
#9999995	19	361
#9999996	42	1764
#9999997	24	576
#9999998	35	1225
#9999999	48	2304
#10000000 rows × 2 columns
	import pandas as pd
	import numpy as np
	from pandarallel import pandarallel

	pandarallel.initialize(progress_bar=True)

	# Create a sample dataframe with 10,000 rows and 2 columns
	np.random.seed(0) # for reproducibility
	df = pd.DataFrame({'numbers': np.random.randint(1, 100, size=10000000)})

	# you might need to wrap your functions if you reference from external sources
	def wrap_func(n):
	return n**2

	df["square_numbers"] = df["numbers"].parallel_apply(wrap_func)

	df

	#INFO: Pandarallel will run on 16 workers.
	#INFO: Pandarallel will use standard multiprocessing data transfer (pipe) to transfer data between the main process and workers.
	#numbers square_numbers
	#0 45 2025
	#1 48 2304
	#2 65 4225
	#3 68 4624
	#4 68 4624
	#... ... ...
	#9999995 19 361
	#9999996 42 1764
	#9999997 24 576
	#9999998 35 1225
	#9999999 48 2304
	#10000000 rows × 2 columns