icexelloss/plus_one_vectorized.py

## plus_one_vectorized.py
from pyspark.sql.functions import pandas_udf, PandasUDFType

# Use pandas_udf to define a Pandas UDF
@pandas_udf('double', PandasUDFType.SCALAR)
# Input/output are both a pandas.Series of doubles

def pandas_plus_one(v):
    return v + 1

df.withColumn('v2', pandas_plus_one(df.v))
	from pyspark.sql.functions import pandas_udf, PandasUDFType

	# Use pandas_udf to define a Pandas UDF
	@pandas_udf('double', PandasUDFType.SCALAR)
	# Input/output are both a pandas.Series of doubles

	def pandas_plus_one(v):
	return v + 1

	df.withColumn('v2', pandas_plus_one(df.v))