Elie A. eliasah

## mvn2sbt.scala
object scala {
   val version = "SCALA_VERSION$"
}

val xml =         <dependencies>
            <dependency>
                <groupId>org.scalanlp</groupId>
                <artifactId>scalala_${scala.version}</artifactId>
                <version>0.3.1</version>
            </dependency>

## config
[user]
	name = Pavan Kumar Sunkara
	email = pavan.sss1991@gmail.com
	username = pksunkara
[init]
	defaultBranch = master
[core]
	editor = nvim
	whitespace = fix,-indent-with-non-tab,trailing-space,cr-at-eol
	pager = delta

## functions.js
// derived from http://en.wikipedia.org/wiki/Algorithms_for_calculating_variance#Parallel_algorithm

function map() {
    emit(1, // Or put a GROUP BY key here
         {sum: this.value, // the field you want stats for
          min: this.value,
          max: this.value,
          count:1,
          diff: 0, // M2,n:  sum((val-mean)^2)
    });

## fr.sh
#!/bin/bash

ES='http://localhost:9200'
ESIDX='test3'
ESTYPE='test'

curl -XDELETE $ES/$ESIDX

curl -XPUT $ES/$ESIDX/ -d '{
	"settings" : {

## sphinx.conf
#############################################################################
## data source definitions
#############################################################################

source users
{
	# data source type. mandatory, no default value
	# known types are mysql, pgsql, mssql, xmlpipe, xmlpipe2, odbc
	type			= mysql

## MovieSimilarities.scala
import spark.SparkContext
import SparkContext._

/**
 * A port of [[http://blog.echen.me/2012/02/09/movie-recommendations-and-more-via-mapreduce-and-scalding/]]
 * to Spark.
 * Uses movie ratings data from MovieLens 100k dataset found at [[http://www.grouplens.org/node/73]]
 */
object MovieSimilarities {

## import.php
<?php

require 'vendor/autoload.php';

use Sherlock\Sherlock;


function pprint($value) {
    print_r($value);
    echo "\r\n";

## install_scala_sbt.sh
#!/bin/sh

# one way (older scala version will be installed)
# sudo apt-get install scala

#2nd way
sudo apt-get remove scala-library scala
wget http://www.scala-lang.org/files/archive/scala-2.11.4.deb
sudo dpkg -i scala-2.11.4.deb
sudo apt-get update

## Distributed systems meta-list.md

      
              1 file
            
          
              73 forks
            
          
              0 comments
            
          
              363 stars
            
          
                macintux
                / Distributed systems meta-list.md
            
            
              Last active
              June 14, 2024 04:47
            
              
                List of distributed systems reading lists, plus miscellanea
              
          
https://ferd.ca/a-distributed-systems-reading-list.html
http://the-paper-trail.org/blog/distributed-systems-theory-for-the-distributed-systems-engineer/
https://github.com/palvaro/CMPS290S-Winter16/blob/master/readings.md
http://muratbuffalo.blogspot.com/2015/12/my-distributed-systems-seminars-reading.html
http://christophermeiklejohn.com/distributed/systems/2013/07/12/readings-in-distributed-systems.html
http://michaelrbernste.in/2013/11/06/distributed-systems-archaeology-works-cited.html
http://rxin.github.io/db-readings/
http://research.microsoft.com/en-us/um/people/lamport/pubs/pubs.html
http://pdos.csail.mit.edu/dsrg/papers/
http://scalingsystems.com/2011/09/07/reading-list-for-distributed-systems/


## spark_parallel_boost.py
from pyspark import SparkContext

import numpy as np

from sklearn.cross_validation import train_test_split, Bootstrap
from sklearn.datasets import make_classification
from sklearn.metrics import accuracy_score
from sklearn.tree import DecisionTreeClassifier

def run(sc):
	object scala {
	val version = "SCALA_VERSION$"
	}

	val xml = <dependencies>
	<dependency>
	<groupId>org.scalanlp</groupId>
	<artifactId>scalala_${scala.version}</artifactId>
	<version>0.3.1</version>
	</dependency>
	[user]
	name = Pavan Kumar Sunkara
	email = pavan.sss1991@gmail.com
	username = pksunkara
	[init]
	defaultBranch = master
	[core]
	editor = nvim
	whitespace = fix,-indent-with-non-tab,trailing-space,cr-at-eol
	pager = delta
	// derived from http://en.wikipedia.org/wiki/Algorithms_for_calculating_variance#Parallel_algorithm

	function map() {
	emit(1, // Or put a GROUP BY key here
	{sum: this.value, // the field you want stats for
	min: this.value,
	max: this.value,
	count:1,
	diff: 0, // M2,n: sum((val-mean)^2)
	});
	#!/bin/bash

	ES='http://localhost:9200'
	ESIDX='test3'
	ESTYPE='test'

	curl -XDELETE $ES/$ESIDX

	curl -XPUT $ES/$ESIDX/ -d '{
	"settings" : {
	#############################################################################
	## data source definitions
	#############################################################################

	source users
	{
	# data source type. mandatory, no default value
	# known types are mysql, pgsql, mssql, xmlpipe, xmlpipe2, odbc
	type = mysql
	import spark.SparkContext
	import SparkContext._

	/**
	* A port of [[http://blog.echen.me/2012/02/09/movie-recommendations-and-more-via-mapreduce-and-scalding/]]
	* to Spark.
	* Uses movie ratings data from MovieLens 100k dataset found at [[http://www.grouplens.org/node/73]]
	*/
	object MovieSimilarities {
	<?php

	require 'vendor/autoload.php';

	use Sherlock\Sherlock;


	function pprint($value) {
	print_r($value);
	echo "\r\n";
	#!/bin/sh

	# one way (older scala version will be installed)
	# sudo apt-get install scala

	#2nd way
	sudo apt-get remove scala-library scala
	wget http://www.scala-lang.org/files/archive/scala-2.11.4.deb
	sudo dpkg -i scala-2.11.4.deb
	sudo apt-get update
	from pyspark import SparkContext

	import numpy as np

	from sklearn.cross_validation import train_test_split, Bootstrap
	from sklearn.datasets import make_classification
	from sklearn.metrics import accuracy_score
	from sklearn.tree import DecisionTreeClassifier

	def run(sc):