Jon Haddad rustyrazorblade

## gist:b1dfc95db126a7aeab88b2c23295b7dd
cat > ./policy-rc.d << EOF
#!/bin/sh
echo "All runlevel operations denied by policy" >&2
exit 101
EOF

## gist:c4947fc37da85bca50e08aa1ef3c7a06
jhaddad@rustyrazorblade ~$ ccm node1 cqlsh
Connected to 3.10 at 127.0.0.1:9042.
[cqlsh 5.0.1 | Cassandra 3.10 | CQL spec 3.4.4 | Native protocol v4]
Use HELP for help.
cqlsh> create KEYSPACE test WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 1};
cqlsh> use test;
cqlsh:test> create table
        ...
cqlsh:test>
cqlsh:test> create table hello(

## gist:60e8b625973ee802b2d4
1|Toy Story (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Toy%20Story%20(1995)|0|0|0|1|1|1|0|0|0|0|0|0|0|0|0|0|0|0|0
2|GoldenEye (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?GoldenEye%20(1995)|0|1|1|0|0|0|0|0|0|0|0|0|0|0|0|0|1|0|0
3|Four Rooms (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Four%20Rooms%20(1995)|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|1|0|0
4|Get Shorty (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Get%20Shorty%20(1995)|0|1|0|0|0|1|0|0|1|0|0|0|0|0|0|0|0|0|0
5|Copycat (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Copycat%20(1995)|0|0|0|0|0|0|1|0|1|0|0|0|0|0|0|0|1|0|0
6|Shanghai Triad (Yao a yao yao dao waipo qiao) (1995)|01-Jan-1995||http://us.imdb.com/Title?Yao+a+yao+yao+dao+waipo+qiao+(1995)|0|0|0|0|0|0|0|0|1|0|0|0|0|0|0|0|0|0|0
7|Twelve Monkeys (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Twelve%20Monkeys%20(1995)|0|0|0|0|0|0|0|0|1|0|0|0|0|0|0|1|0|0|0
8|Babe (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Babe%20(1995)|0|0|0|0|1|1|0|0|1|0|0|0|0|0|0|0|0

## gist:4e74301de9192f2e8bc2
from pyspark.sql import SQLContext
sql = SQLContext(sc)

df = sql.read.format("org.apache.spark.sql.cassandra").load(keyspace="lens", table="raw_data")
df.write.format('parquet').save(hdfs_path)

## titan.groovy
graph = TitanFactory.build().set('storage.backend', 'inmemory').open()

g = graph.traversal()

jcvd = graph.addVertex(label, "actor", "name", "jean claude van damme")
kick = graph.addVertex(label, "movie", "name", "Kickboxer", "year", 1989)
blood = graph.addVertex(label, "movie", "name", "Bloodsport", "year", 1988)
timecop = graph.addVertex(label, "movie", "name", "Timecop", "year", 1994)
inferno = graph.addVertex(label, "movie", "name", "Inferno","year", 1999)
sd = graph.addVertex(label, "movie", "name", "Sudden Death","year", 1995)

## gist:cb42d4aee0449233b463
# https://github.com/apache/cassandra/blob/cassandra-3.0/src/java/org/apache/cassandra/io/sstable/format/big/BigTableWriter.java#L135

# UnfilteredRowIteratorSerializer
https://github.com/apache/cassandra/blob/cassandra-3.0/src/java/org/apache/cassandra/db/rows/UnfilteredRowIteratorSerializer.java#L34-34

Partition Header: <key><flags><s_header>[<partition_deletion>][<static_row>][<row_estimate>]
Then the rows


https://github.com/apache/cassandra/blob/cassandra-3.0/src/java/org/apache/cassandra/db/rows/BufferCell.java#L200-200

## gist:d4b2b048c4bd88e538ce
from pyspark.sql import SQLContext
sql = SQLContext(sc)
mysql_movies = sql.read.jdbc("jdbc:mysql://127.0.0.1:3307/movielens?user=root", "movielens.movies")
mysql_movies.write.format("org.apache.spark.sql.cassandra").options(table="movies", keyspace="lens").save(mode="append")

## gist:9a38a9499a7531eefd1e
####### SPARK JOB #############

from pyspark import SparkContext
from pyspark.sql import SQLContext

sc = SparkContext()
sql = SQLContext(sc)
mysql_movies = sql.read.jdbc("jdbc:mysql://127.0.0.1:3307/movielens?user=root", "movielens.movies")
print mysql_movies.head()
tmp = mysql_movies.write.format("org.apache.spark.sql.cassandra").options(table="movie", keyspace="lens").save()

## gist:3865a4d26dd45cc7e15b
<std macros>:5:8: 6:42 error: mismatched types:
 expected `()`,
    found `core::result::Result<_, _>`
(expected (),
    found enum `core::result::Result`) [E0308]
<std macros>:5 return $ crate:: result:: Result:: Err (
<std macros>:6 $ crate:: convert:: From:: from ( err ) ) } } )
<std macros>:1:1: 6:48 note: in expansion of try!
tests/traversals.rs:82:40: 82:65 note: expansion site
<std macros>:5:8: 6:42 help: run `rustc --explain E0308` to see a detailed explanation

## gist:959ad9473df74cea887b
from pyspark.sql import SQLContext
sql = SQLContext(sc)
apd = sql.read.format("org.apache.spark.sql.cassandra").load(keyspace="labor", table="average_price_data")
	cat > ./policy-rc.d << EOF
	#!/bin/sh
	echo "All runlevel operations denied by policy" >&2
	exit 101
	EOF
	jhaddad@rustyrazorblade ~$ ccm node1 cqlsh
	Connected to 3.10 at 127.0.0.1:9042.
	[cqlsh 5.0.1 \| Cassandra 3.10 \| CQL spec 3.4.4 \| Native protocol v4]
	Use HELP for help.
	cqlsh> create KEYSPACE test WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 1};
	cqlsh> use test;
	cqlsh:test> create table
	...
	cqlsh:test>
	cqlsh:test> create table hello(
	1\|Toy Story (1995)\|01-Jan-1995\|\|http://us.imdb.com/M/title-exact?Toy%20Story%20(1995)\|0\|0\|0\|1\|1\|1\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0
	2\|GoldenEye (1995)\|01-Jan-1995\|\|http://us.imdb.com/M/title-exact?GoldenEye%20(1995)\|0\|1\|1\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|1\|0\|0
	3\|Four Rooms (1995)\|01-Jan-1995\|\|http://us.imdb.com/M/title-exact?Four%20Rooms%20(1995)\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0\|1\|0\|0
	4\|Get Shorty (1995)\|01-Jan-1995\|\|http://us.imdb.com/M/title-exact?Get%20Shorty%20(1995)\|0\|1\|0\|0\|0\|1\|0\|0\|1\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0
	5\|Copycat (1995)\|01-Jan-1995\|\|http://us.imdb.com/M/title-exact?Copycat%20(1995)\|0\|0\|0\|0\|0\|0\|1\|0\|1\|0\|0\|0\|0\|0\|0\|0\|1\|0\|0
	6\|Shanghai Triad (Yao a yao yao dao waipo qiao) (1995)\|01-Jan-1995\|\|http://us.imdb.com/Title?Yao+a+yao+yao+dao+waipo+qiao+(1995)\|0\|0\|0\|0\|0\|0\|0\|0\|1\|0\|0\|0\|0\|0\|0\|0\|0\|0\|0
	7\|Twelve Monkeys (1995)\|01-Jan-1995\|\|http://us.imdb.com/M/title-exact?Twelve%20Monkeys%20(1995)\|0\|0\|0\|0\|0\|0\|0\|0\|1\|0\|0\|0\|0\|0\|0\|1\|0\|0\|0
	8\|Babe (1995)\|01-Jan-1995\|\|http://us.imdb.com/M/title-exact?Babe%20(1995)\|0\|0\|0\|0\|1\|1\|0\|0\|1\|0\|0\|0\|0\|0\|0\|0\|0
	from pyspark.sql import SQLContext
	sql = SQLContext(sc)

	df = sql.read.format("org.apache.spark.sql.cassandra").load(keyspace="lens", table="raw_data")
	df.write.format('parquet').save(hdfs_path)
	graph = TitanFactory.build().set('storage.backend', 'inmemory').open()

	g = graph.traversal()

	jcvd = graph.addVertex(label, "actor", "name", "jean claude van damme")
	kick = graph.addVertex(label, "movie", "name", "Kickboxer", "year", 1989)
	blood = graph.addVertex(label, "movie", "name", "Bloodsport", "year", 1988)
	timecop = graph.addVertex(label, "movie", "name", "Timecop", "year", 1994)
	inferno = graph.addVertex(label, "movie", "name", "Inferno","year", 1999)
	sd = graph.addVertex(label, "movie", "name", "Sudden Death","year", 1995)
	# https://github.com/apache/cassandra/blob/cassandra-3.0/src/java/org/apache/cassandra/io/sstable/format/big/BigTableWriter.java#L135

	# UnfilteredRowIteratorSerializer
	https://github.com/apache/cassandra/blob/cassandra-3.0/src/java/org/apache/cassandra/db/rows/UnfilteredRowIteratorSerializer.java#L34-34

	Partition Header: <key><flags><s_header>[<partition_deletion>][<static_row>][<row_estimate>]
	Then the rows


	https://github.com/apache/cassandra/blob/cassandra-3.0/src/java/org/apache/cassandra/db/rows/BufferCell.java#L200-200
	from pyspark.sql import SQLContext
	sql = SQLContext(sc)
	mysql_movies = sql.read.jdbc("jdbc:mysql://127.0.0.1:3307/movielens?user=root", "movielens.movies")
	mysql_movies.write.format("org.apache.spark.sql.cassandra").options(table="movies", keyspace="lens").save(mode="append")
	####### SPARK JOB #############

	from pyspark import SparkContext
	from pyspark.sql import SQLContext

	sc = SparkContext()
	sql = SQLContext(sc)
	mysql_movies = sql.read.jdbc("jdbc:mysql://127.0.0.1:3307/movielens?user=root", "movielens.movies")
	print mysql_movies.head()
	tmp = mysql_movies.write.format("org.apache.spark.sql.cassandra").options(table="movie", keyspace="lens").save()
	<std macros>:5:8: 6:42 error: mismatched types:
	expected `()`,
	found `core::result::Result<_, _>`
	(expected (),
	found enum `core::result::Result`) [E0308]
	<std macros>:5 return $ crate:: result:: Result:: Err (
	<std macros>:6 $ crate:: convert:: From:: from ( err ) ) } } )
	<std macros>:1:1: 6:48 note: in expansion of try!
	tests/traversals.rs:82:40: 82:65 note: expansion site
	<std macros>:5:8: 6:42 help: run `rustc --explain E0308` to see a detailed explanation
	from pyspark.sql import SQLContext
	sql = SQLContext(sc)
	apd = sql.read.format("org.apache.spark.sql.cassandra").load(keyspace="labor", table="average_price_data")