turgeonmaxime/sens_spec_sim.R

## sens_spec_sim.R
library(tidyverse)

expit <- function(t) exp(t)/(1 + exp(t))

n <- 1000000
prev_vec <- c(0.01, 0.05, 0.1, 0.25, 0.5)

results <- purrr::map_df(prev_vec, \(prev) {
    # Generate data
    dvec <- rbinom(n, prob = prev, size = 1)
    xvec <- rnorm(n, 2*dvec - 1)
    yvec <- ifelse(xvec > 0, 1, 0)
    sel_vec <- rbinom(n, prob = expit(xvec),
                      size = 1)

    # Without selection
    sens <- sum(dvec & yvec)/sum(dvec)
    spec <- sum(!dvec & !yvec)/sum(!dvec)

    # With selection
    sens2 <- sum(dvec & yvec & sel_vec)/sum(dvec & sel_vec)
    spec2 <- sum(!dvec & !yvec & sel_vec)/sum(!dvec & sel_vec)

    tribble(
        ~metric, ~no_select, ~select,
        "Sens", sens, sens2,
        "Spec", spec, spec2
    ) |> mutate(prev = prev)
})

results |>
    pivot_longer(cols = c("no_select", "select"),
                 names_to = "Selection",
                 values_to = "Value") |>
    ggplot(aes(prev, Value, colour = Selection)) +
        geom_point() +
        geom_line() +
        facet_grid(~metric) +
    cowplot::theme_minimal_hgrid() +
    scale_y_continuous(limits = c(0, 1)) +
    xlab("Prevalence") + ylab("")
	library(tidyverse)

	expit <- function(t) exp(t)/(1 + exp(t))

	n <- 1000000
	prev_vec <- c(0.01, 0.05, 0.1, 0.25, 0.5)

	results <- purrr::map_df(prev_vec, \(prev) {
	# Generate data
	dvec <- rbinom(n, prob = prev, size = 1)
	xvec <- rnorm(n, 2*dvec - 1)
	yvec <- ifelse(xvec > 0, 1, 0)
	sel_vec <- rbinom(n, prob = expit(xvec),
	size = 1)

	# Without selection
	sens <- sum(dvec & yvec)/sum(dvec)
	spec <- sum(!dvec & !yvec)/sum(!dvec)

	# With selection
	sens2 <- sum(dvec & yvec & sel_vec)/sum(dvec & sel_vec)
	spec2 <- sum(!dvec & !yvec & sel_vec)/sum(!dvec & sel_vec)

	tribble(
	~metric, ~no_select, ~select,
	"Sens", sens, sens2,
	"Spec", spec, spec2
	) \|> mutate(prev = prev)
	})

	results \|>
	pivot_longer(cols = c("no_select", "select"),
	names_to = "Selection",
	values_to = "Value") \|>
	ggplot(aes(prev, Value, colour = Selection)) +
	geom_point() +
	geom_line() +
	facet_grid(~metric) +
	cowplot::theme_minimal_hgrid() +
	scale_y_continuous(limits = c(0, 1)) +
	xlab("Prevalence") + ylab("")