girisandeep/saving-loading-sequencefiles.scala

## saving-loading-sequencefiles.scala
//Save it
var rdd = sc.parallelize(Array(("key1", 1.0), ("key2", 2.0), ("key3", 3.0)), 2)
rdd.saveAsSequenceFile("pysequencefile1")

//Load it
import org.apache.hadoop.io.DoubleWritable
import org.apache.hadoop.io.Text

val myrdd = sc.sequenceFile(
"pysequencefile1",
classOf[Text], classOf[DoubleWritable])

val result = myrdd.map{case (x, y) => (x.toString, y.get())}
result.collect()

//Array((key1,1.0), (key2,2.0), (key3,3.0))
	//Save it
	var rdd = sc.parallelize(Array(("key1", 1.0), ("key2", 2.0), ("key3", 3.0)), 2)
	rdd.saveAsSequenceFile("pysequencefile1")

	//Load it
	import org.apache.hadoop.io.DoubleWritable
	import org.apache.hadoop.io.Text

	val myrdd = sc.sequenceFile(
	"pysequencefile1",
	classOf[Text], classOf[DoubleWritable])

	val result = myrdd.map{case (x, y) => (x.toString, y.get())}
	result.collect()

	//Array((key1,1.0), (key2,2.0), (key3,3.0))