VinACE

## 1.txt
Empty_test_file

## Teardown a framework in mesos,shutdown
curl -d@/tmp/post.txt -X POST http://your_mesos:5050/master/shutdown

vi /tmp/post.txt

frameworkId=23423-23423-234234-234234

## pyspark cassandra
 git clone https://github.com/TargetHolding/pyspark-cassandra.git


http://www.scala-sbt.org/release/docs/Installing-sbt-on-Linux.html

https://medium.com/@amirziai/running-pyspark-with-cassandra-in-jupyter-2bf5e95c319#.xhvqljmy6


./bin/spark-submit --packages com.datastax.spark:spark-cassandra-connector_2.11:1.5.0-M2 ../Main/Code/myPysparkFile.py

## python_streaming
https://community.cloudera.com/t5/Hadoop-101-Training-Quickstart/Python-Streaming-ImportError-No-module-named-streaming/td-p/42804

## pyspark_interactive_with_datastax_connector.py
## invoking pyspark as follows: ##
# /path/to/spark-1.2.0-bin-hadoop2.4/bin/pyspark --jars /path/to/spark-1.2.0-bin-hadoop2.4/jars/spark-cassandra-connector-assembly-1.2.0-SNAPSHOT.jar
# first, stop the spark context launched by pyspark to avoid the conflict
sc.stop()

from py4j.java_gateway import java_import
from pyspark import SparkConf

conf = (SparkConf()
         .setMaster("local")

## python_dataframe
http://takwatanabe.me/snippets/cs-pyspark.html#sql-in-pyspark

## df2json.py
"""
tiny script to convert a pandas data frame into a JSON object
"""

import ujson as json
import pandas
import numpy as np

df = pandas.DataFrame({
    "time" : [1,2,3,4,5],

## gist:f13164c33d16735579572bb955067bf8
 /home/centos/spark-2.0.2-bin-hadoop2.7/bin/spark-submit --packages org.apache.spark:spark-streaming-kafka_2.10:1.6.3  --conf spark.cassandra.connection.host=10.0.0.12 --master mesos://10.0.0.11:5050  testKafkastream.py 10.0.0.11:2181 ihealth


 /home/centos/spark-2.0.2-bin-hadoop2.7/bin/spark-submit --packages com.datastax.spark:spark-cassandra-connector_2.11:2.0.0-M3,TargetHolding/pyspark-cassandra:0.1.5,org.apache.spark:spark-streaming-kafka-0-8_2.11:2.0.1 --conf spark.cassandra.connection.host=10.0.0.12 v_example.py ihealth


## jupyter_pyspark
Jupyter_pyspark Links

## spark_frame_work tear_down
sudo curl -d@/tmp/post.txt -X POST http://your_mesos:5050/master/shutdown

/tmp/post.txt is a file with the follow content:

frameworkId=23423-23423-234234-234234
	curl -d@/tmp/post.txt -X POST http://your_mesos:5050/master/shutdown

	vi /tmp/post.txt

	frameworkId=23423-23423-234234-234234
	git clone https://github.com/TargetHolding/pyspark-cassandra.git


	http://www.scala-sbt.org/release/docs/Installing-sbt-on-Linux.html

	https://medium.com/@amirziai/running-pyspark-with-cassandra-in-jupyter-2bf5e95c319#.xhvqljmy6


	./bin/spark-submit --packages com.datastax.spark:spark-cassandra-connector_2.11:1.5.0-M2 ../Main/Code/myPysparkFile.py
	## invoking pyspark as follows: ##
	# /path/to/spark-1.2.0-bin-hadoop2.4/bin/pyspark --jars /path/to/spark-1.2.0-bin-hadoop2.4/jars/spark-cassandra-connector-assembly-1.2.0-SNAPSHOT.jar
	# first, stop the spark context launched by pyspark to avoid the conflict
	sc.stop()

	from py4j.java_gateway import java_import
	from pyspark import SparkConf

	conf = (SparkConf()
	.setMaster("local")
	"""
	tiny script to convert a pandas data frame into a JSON object
	"""

	import ujson as json
	import pandas
	import numpy as np

	df = pandas.DataFrame({
	"time" : [1,2,3,4,5],
	/home/centos/spark-2.0.2-bin-hadoop2.7/bin/spark-submit --packages org.apache.spark:spark-streaming-kafka_2.10:1.6.3 --conf spark.cassandra.connection.host=10.0.0.12 --master mesos://10.0.0.11:5050 testKafkastream.py 10.0.0.11:2181 ihealth


	/home/centos/spark-2.0.2-bin-hadoop2.7/bin/spark-submit --packages com.datastax.spark:spark-cassandra-connector_2.11:2.0.0-M3,TargetHolding/pyspark-cassandra:0.1.5,org.apache.spark:spark-streaming-kafka-0-8_2.11:2.0.1 --conf spark.cassandra.connection.host=10.0.0.12 v_example.py ihealth
	sudo curl -d@/tmp/post.txt -X POST http://your_mesos:5050/master/shutdown

	/tmp/post.txt is a file with the follow content:

	frameworkId=23423-23423-234234-234234