Scott Hoover githoov

## survival.model.lookml
# preliminaries #

- connection: [your_database_connection]
- scoping: true
- case_sensitive: false


# views to explore #

- explore: payments

## db_space.yml
- explore: db_space
  label: 'DB Space'
  hidden: true

- view: db_space
  derived_table:
    sql: |
      SELECT name AS table
        , trim(pgn.nspname) AS schema
        , SUM(b.mbytes) AS megabytes

## table_skew.yml
- explore: table_skew
  hidden: true
- view: table_skew
  derived_table:
    sql: |
      SELECT *
      FROM svv_table_info
  fields:

  - dimension: database

## load_errors.yml
- explore: etl_errors
  label: 'ETL Errors'
  hidden: true
- view: etl_errors
  derived_table:
    sql: |
      select distinct errors.starttime as error_time
        , detail.filename as file_name
        , errors.err_reason
      from stl_loaderror_detail as detail, stl_load_errors as errors

## recent_data_load.yml
- explore: data_loads
  hidden: true
- view: data_loads
  derived_table:
    sql: |
      select replace(regexp_substr(filename, '//[a-zA-Z0-9\-]+/'), '/', '') as root_bucket
        , case
            when replace(regexp_substr(filename, '//[a-zA-Z0-9\-]+/'), '/', '') = 'snowplow-looker-emr-out'
            then 'snowplow'
            else regexp_replace(regexp_substr(filename, '/[a-zA-Z0-9\\-\\_]+\\.[a-zA-Z]{3,4}'), '(/|[0-9]{2,})', '')

## view_definitions.yml
- explore: view_definitions
  from: pg_views
  hidden: true
- view: pg_views
  sql_table_name: pg_views
  fields:

  - dimension: definition
    sql: ${TABLE}.definition

## zendesk_chat_events.yaml
# preliminaries #

- connection: your_connection
- scoping: true
- case_sensitive: false


- explore: zendesk_chat_events
- view: zendesk_chat_events
  derived_table:

## user_growth.R
# preliminaries
# using pinger
# 2014 (control): https://metanew.looker.com/sql/cb77dv2thvbrxd
# 2015 (treat):   https://metanew.looker.com/sql/xqttksqxp3qgrn
# using license
# 2014 (control): https://metanew.looker.com/sql/fm8hgny7f9yrkh
# 2015 (treat):   https://metanew.looker.com/sql/rq2sxqkwqmc7z2

# read in 2014 and 2015 data sets
Y2014 <- read.csv(file = "~/Downloads/sql_runner_fm8hgny7f9yrkh_2016-04-09_05-37-37.csv", header = TRUE)

## discourse_and_chats.R
# input queries
# tickets:         https://metanew.looker.com/x/CQ9zcpw
# discourse views: https://metanew.looker.com/x/yYf3CPH

# load data
tickets  <- read.csv(file = "~/Downloads/ticket_topics.csv", header = TRUE)
articles <- read.csv(file = "~/Downloads/discourse_topics.csv", header = TRUE)

# rename columns
names(tickets) <- c("week", "topic", "chats")

## cadence_over_time.R
# load data
df <- read.csv(file = "~/Downloads/cadence.csv", header = TRUE)
names(df) <- c("id", "month", "in_trial", "topic", "number_of_chats", "median_time_to_reply", "iqr")

# create a summary table for inspection
summary.df <- ddply(na.omit(subset(df, number_of_chats > 5)), .(month), summarize, cadence = median(median_time_to_reply), spread = median(iqr))

# plot median of medians over time
ggplot(na.omit(subset(df, number_of_chats > 5)), aes(x = month, y = median_time_to_reply)) + stat_summary(fun.data = mean_cl_normal)
	# preliminaries #

	- connection: [your_database_connection]
	- scoping: true
	- case_sensitive: false


	# views to explore #

	- explore: payments
	- explore: db_space
	label: 'DB Space'
	hidden: true

	- view: db_space
	derived_table:
	sql: \|
	SELECT name AS table
	, trim(pgn.nspname) AS schema
	, SUM(b.mbytes) AS megabytes
	- explore: table_skew
	hidden: true
	- view: table_skew
	derived_table:
	sql: \|
	SELECT *
	FROM svv_table_info
	fields:

	- dimension: database
	- explore: etl_errors
	label: 'ETL Errors'
	hidden: true
	- view: etl_errors
	derived_table:
	sql: \|
	select distinct errors.starttime as error_time
	, detail.filename as file_name
	, errors.err_reason
	from stl_loaderror_detail as detail, stl_load_errors as errors
	- explore: data_loads
	hidden: true
	- view: data_loads
	derived_table:
	sql: \|
	select replace(regexp_substr(filename, '//[a-zA-Z0-9\-]+/'), '/', '') as root_bucket
	, case
	when replace(regexp_substr(filename, '//[a-zA-Z0-9\-]+/'), '/', '') = 'snowplow-looker-emr-out'
	then 'snowplow'
	else regexp_replace(regexp_substr(filename, '/[a-zA-Z0-9\\-\\_]+\\.[a-zA-Z]{3,4}'), '(/\|[0-9]{2,})', '')
	- explore: view_definitions
	from: pg_views
	hidden: true
	- view: pg_views
	sql_table_name: pg_views
	fields:

	- dimension: definition
	sql: ${TABLE}.definition
	# preliminaries #

	- connection: your_connection
	- scoping: true
	- case_sensitive: false


	- explore: zendesk_chat_events
	- view: zendesk_chat_events
	derived_table:
	# preliminaries
	# using pinger
	# 2014 (control): https://metanew.looker.com/sql/cb77dv2thvbrxd
	# 2015 (treat): https://metanew.looker.com/sql/xqttksqxp3qgrn
	# using license
	# 2014 (control): https://metanew.looker.com/sql/fm8hgny7f9yrkh
	# 2015 (treat): https://metanew.looker.com/sql/rq2sxqkwqmc7z2

	# read in 2014 and 2015 data sets
	Y2014 <- read.csv(file = "~/Downloads/sql_runner_fm8hgny7f9yrkh_2016-04-09_05-37-37.csv", header = TRUE)
	# input queries
	# tickets: https://metanew.looker.com/x/CQ9zcpw
	# discourse views: https://metanew.looker.com/x/yYf3CPH

	# load data
	tickets <- read.csv(file = "~/Downloads/ticket_topics.csv", header = TRUE)
	articles <- read.csv(file = "~/Downloads/discourse_topics.csv", header = TRUE)

	# rename columns
	names(tickets) <- c("week", "topic", "chats")
	# load data
	df <- read.csv(file = "~/Downloads/cadence.csv", header = TRUE)
	names(df) <- c("id", "month", "in_trial", "topic", "number_of_chats", "median_time_to_reply", "iqr")

	# create a summary table for inspection
	summary.df <- ddply(na.omit(subset(df, number_of_chats > 5)), .(month), summarize, cadence = median(median_time_to_reply), spread = median(iqr))

	# plot median of medians over time
	ggplot(na.omit(subset(df, number_of_chats > 5)), aes(x = month, y = median_time_to_reply)) + stat_summary(fun.data = mean_cl_normal)