smartkiwi/init_pyspark.py

## init_pyspark.py
import os
os.environ['SPARK_HOME'] = '/root/spark/'

# And Python path
import sys
sys.path.insert(0, '/root/spark/python')

# Detect the PySpark URL
CLUSTER_URL = open('/root/spark-ec2/cluster-url').read().strip()
print CLUSTER_URL

# <codecell>

from pyspark import  SparkContext
sc = SparkContext( CLUSTER_URL, 'pyspark')
	import os
	os.environ['SPARK_HOME'] = '/root/spark/'

	# And Python path
	import sys
	sys.path.insert(0, '/root/spark/python')

	# Detect the PySpark URL
	CLUSTER_URL = open('/root/spark-ec2/cluster-url').read().strip()
	print CLUSTER_URL

	# <codecell>

	from pyspark import SparkContext
	sc = SparkContext( CLUSTER_URL, 'pyspark')