Mark Andreev mrk-andreev

## ipython_notebook_in_git.md

      
              2 files
            
          
              0 forks
            
          
              0 comments
            
          
              0 stars
            
          
                mrk-andreev
                /  ipython_notebook_in_git.md
            
            
              Created
              May 5, 2017 11:11
                — forked from pbugnion/ ipython_notebook_in_git.md
            
              
                Keeping IPython notebooks under Git version control
              
          
    This gist lets you keep IPython notebooks in git repositories. It tells git to ignore prompt numbers and program outputs when checking that a file has changed.
To use the script, follow the instructions given in the script's docstring.
For further details, read this blogpost.
The procedure outlined here is inspired by this answer on Stack Overflow.

  
## ipython_notebook_in_git.md

      
              2 files
            
          
              0 forks
            
          
              0 comments
            
          
              0 stars
            
          
                mrk-andreev
                /  ipython_notebook_in_git.md
            
            
              Created
              May 5, 2017 11:11
                — forked from pbugnion/ ipython_notebook_in_git.md
            
              
                Keeping IPython notebooks under Git version control
              
          
    This gist lets you keep IPython notebooks in git repositories. It tells git to ignore prompt numbers and program outputs when checking that a file has changed.
To use the script, follow the instructions given in the script's docstring.
For further details, read this blogpost.
The procedure outlined here is inspired by this answer on Stack Overflow.

  
## jpn_tmonkey.js
// ==UserScript==
// @name         JupyterExt
// @namespace    http://tampermonkey.net/
// @version      0.1
// @description
// @author       mrk-andreev
// @match        http://localhost:8888/notebooks/*
// @grant        none
// ==/UserScript==

## upyterUserscript.js
// ==UserScript==
// @name         JupyterUserscript
// @version      0.1
// @author       Mark Andreev
// ==/UserScript==

(function() {
    'use strict';

    var YOUR_NAME = 'Mark,';

## clickhouse-database-size.sql
select concat(database, '.', table)                         as table,
       formatReadableSize(sum(bytes))                       as size,
       sum(rows)                                            as rows,
       max(modification_time)                               as latest_modification,
       sum(bytes)                                           as bytes_size,
       any(engine)                                          as engine,
       formatReadableSize(sum(primary_key_bytes_in_memory)) as primary_keys_size
from system.parts
where active
group by database, table

## in_notIn.scala
object PlaygroundUtil {
 def in(main: DataFrame, dict: DataFrame, joinColumn: String): DataFrame = {
   main.join(dict, Seq(joinColumn), "left_semi")
 }

 def notIn(main: DataFrame, dict: DataFrame, joinColumn: String): DataFrame = {
   main.join(dict, Seq(joinColumn), "left_anti")
 }
}

## test_in.scala
test("in") {
 # main = createDataDataset(Seq(Data("a", "Berlin"), Data("b", "Madrid"), Data("c", "Rome")))
 # dict = createDictDataset(Seq(Dict("a"), Dict("b")))
 val result = main.join(dict, Seq("index"), "left_semi")
 val expected = createDataDataset(Seq(
   Data("a", "Berlin"), Data("b", "Madrid"))).orderBy("index")

 assert(result.schema === expected.schema)
 assert(result.collect() === expected.toDF().collect())
}
	// ==UserScript==
	// @name JupyterExt
	// @namespace http://tampermonkey.net/
	// @version 0.1
	// @description
	// @author mrk-andreev
	// @match http://localhost:8888/notebooks/*
	// @grant none
	// ==/UserScript==
	// ==UserScript==
	// @name JupyterUserscript
	// @version 0.1
	// @author Mark Andreev
	// ==/UserScript==

	(function() {
	'use strict';

	var YOUR_NAME = 'Mark,';
	select concat(database, '.', table) as table,
	formatReadableSize(sum(bytes)) as size,
	sum(rows) as rows,
	max(modification_time) as latest_modification,
	sum(bytes) as bytes_size,
	any(engine) as engine,
	formatReadableSize(sum(primary_key_bytes_in_memory)) as primary_keys_size
	from system.parts
	where active
	group by database, table
	object PlaygroundUtil {
	def in(main: DataFrame, dict: DataFrame, joinColumn: String): DataFrame = {
	main.join(dict, Seq(joinColumn), "left_semi")
	}

	def notIn(main: DataFrame, dict: DataFrame, joinColumn: String): DataFrame = {
	main.join(dict, Seq(joinColumn), "left_anti")
	}
	}
	test("in") {
	# main = createDataDataset(Seq(Data("a", "Berlin"), Data("b", "Madrid"), Data("c", "Rome")))
	# dict = createDictDataset(Seq(Dict("a"), Dict("b")))
	val result = main.join(dict, Seq("index"), "left_semi")
	val expected = createDataDataset(Seq(
	Data("a", "Berlin"), Data("b", "Madrid"))).orderBy("index")

	assert(result.schema === expected.schema)
	assert(result.collect() === expected.toDF().collect())
	}