ian-whitestone/a_a_sim.py

## a_a_sim.py
import numpy as np

def bayesian_rate_comparison(
    control_successes,
    control_samples,
    test_successes,
    test_samples,
    prior_a=0,
    prior_b=0
):

    num_samples = 50000

    control_samples = np.random.beta(
        control_successes + prior_a,
        control_samples - control_successes + prior_b,
        size=num_samples
    )

    test_samples = np.random.beta(
        test_successes + prior_a,
        test_samples - test_successes + prior_b,
        size=num_samples
    )

    p_test_gt_control = (test_samples > control_samples).mean()
    p_control_gt_test = (control_samples > test_samples).mean()

    return p_test_gt_control, p_control_gt_test

conversion_rate = 0.2
num_sessions = 10000

prior_strength = 1000
prior_probability = conversion_rate
prior_a, prior_b = prior_strength * prior_probability, prior_strength * (1 - prior_probability)

bayesian_probas = []
bayesian_probas_w_prior = []
for _ in range(0, 5000):
    control = np.random.choice([0, 1], p=[1-conversion_rate, conversion_rate], size=num_sessions)
    test = np.random.choice([0, 1], p=[1-conversion_rate, conversion_rate], size=num_sessions)

    p_test_gt_control, p_control_gt_test = bayesian_rate_comparison(
        control.sum(),
        num_sessions,
        test.sum(),
        num_sessions
    )
    bayesian_probas.append((p_test_gt_control, p_control_gt_test))

    p_test_gt_control, p_control_gt_test = bayesian_rate_comparison(
        control.sum(),
        num_sessions,
        test.sum(),
        num_sessions,
        prior_a,
        prior_b
    )
    bayesian_probas_w_prior.append((p_test_gt_control, p_control_gt_test))

for test_type, probas in {'with no priors': bayesian_probas, 'with priors': bayesian_probas_w_prior}.items():
    print(f"\nResults for bayesian test {test_type}")
    for threshold in [0.975, 0.85]:
        false_positives = [
            1
            for p_test_gt_control, p_control_gt_test in probas
            if (p_test_gt_control >= threshold or p_control_gt_test >= threshold)
        ]

        print(
            f"Detected {len(false_positives)} false positives in {len(probas)} simulated experiments "
            f"({len(false_positives)/len(probas):0.2%}) at {threshold:0.1%} threshold"
        )
	import numpy as np

	def bayesian_rate_comparison(
	control_successes,
	control_samples,
	test_successes,
	test_samples,
	prior_a=0,
	prior_b=0
	):

	num_samples = 50000

	control_samples = np.random.beta(
	control_successes + prior_a,
	control_samples - control_successes + prior_b,
	size=num_samples
	)

	test_samples = np.random.beta(
	test_successes + prior_a,
	test_samples - test_successes + prior_b,
	size=num_samples
	)

	p_test_gt_control = (test_samples > control_samples).mean()
	p_control_gt_test = (control_samples > test_samples).mean()

	return p_test_gt_control, p_control_gt_test

	conversion_rate = 0.2
	num_sessions = 10000

	prior_strength = 1000
	prior_probability = conversion_rate
	prior_a, prior_b = prior_strength * prior_probability, prior_strength * (1 - prior_probability)

	bayesian_probas = []
	bayesian_probas_w_prior = []
	for _ in range(0, 5000):
	control = np.random.choice([0, 1], p=[1-conversion_rate, conversion_rate], size=num_sessions)
	test = np.random.choice([0, 1], p=[1-conversion_rate, conversion_rate], size=num_sessions)

	p_test_gt_control, p_control_gt_test = bayesian_rate_comparison(
	control.sum(),
	num_sessions,
	test.sum(),
	num_sessions
	)
	bayesian_probas.append((p_test_gt_control, p_control_gt_test))

	p_test_gt_control, p_control_gt_test = bayesian_rate_comparison(
	control.sum(),
	num_sessions,
	test.sum(),
	num_sessions,
	prior_a,
	prior_b
	)
	bayesian_probas_w_prior.append((p_test_gt_control, p_control_gt_test))

	for test_type, probas in {'with no priors': bayesian_probas, 'with priors': bayesian_probas_w_prior}.items():
	print(f"\nResults for bayesian test {test_type}")
	for threshold in [0.975, 0.85]:
	false_positives = [
	1
	for p_test_gt_control, p_control_gt_test in probas
	if (p_test_gt_control >= threshold or p_control_gt_test >= threshold)
	]

	print(
	f"Detected {len(false_positives)} false positives in {len(probas)} simulated experiments "
	f"({len(false_positives)/len(probas):0.2%}) at {threshold:0.1%} threshold"
	)