Created
May 3, 2025 15:43
-
-
Save tannsr/4359e86ac4796ad863fc28f9171d8c9e to your computer and use it in GitHub Desktop.
Libro3_EstadisticaInferencial.ipynb
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
{ | |
"cells": [ | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "view-in-github", | |
"colab_type": "text" | |
}, | |
"source": [ | |
"<a href=\"https://colab.research.google.com/gist/tannsr/4359e86ac4796ad863fc28f9171d8c9e/libro3_estadisticainferencial.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>" | |
] | |
}, | |
{ | |
"cell_type": "markdown", | |
"source": [ | |
"Una estadística es una función de una muestra aleatoria que no depende de parámetros desconocidos." | |
], | |
"metadata": { | |
"id": "WL8hitQBqT3L" | |
}, | |
"id": "WL8hitQBqT3L" | |
}, | |
{ | |
"cell_type": "markdown", | |
"source": [ | |
"Una muestra aleatoria es una colección de variables aleatorias $X_1, . . . , X_n$ que son independientes e idénticamente distribui-\n", | |
"das." | |
], | |
"metadata": { | |
"id": "SUlU-L5ey_MZ" | |
}, | |
"id": "SUlU-L5ey_MZ" | |
}, | |
{ | |
"cell_type": "code", | |
"source": [], | |
"metadata": { | |
"id": "_Egm6Cqryps9" | |
}, | |
"id": "_Egm6Cqryps9", | |
"execution_count": null, | |
"outputs": [] | |
}, | |
{ | |
"cell_type": "markdown", | |
"source": [ | |
"##Estimadores\n", | |
"\n", | |
"Un estimador es una regla o función que se utiliza para calcular un valor aproximado de un parámetro poblacional desconocido, basándose en los datos de una muestra aleatoria extraída de esa población. El valor específico obtenido al aplicar esta regla a una muestra particular se denomina estimación." | |
], | |
"metadata": { | |
"id": "7KeP_JkeqWNo" | |
}, | |
"id": "7KeP_JkeqWNo" | |
}, | |
{ | |
"cell_type": "markdown", | |
"source": [ | |
"Un estimador puntual para un parámetro desconocido θ es una estadística denotada por θ que se propone para estimar el parámetro.\n", | |
"\n", | |
"Propiedades más importantes de los estimadores:\n", | |
"\n", | |
"1. Insesgadez (Unbiasedness):\n", | |
"\n", | |
"Un estimador $\\hat{\\theta}$\n", | |
" de un parámetro θ es insesgado si su valor esperado (la media de su distribución muestral) es igual al verdadero valor del parámetro.\n", | |
"Matemáticamente: $ E[\\hat{\\theta}]=\\theta$\n", | |
"\n", | |
"El sesgo se define como $\\text{Sesgo}(\\hat{\\theta}) = E[\\hat{\\theta}]-\\theta $\n", | |
"\n", | |
"2. Eficiencia (Efficiency):\n", | |
"\n", | |
"La eficiencia se refiere a la precisión de un estimador. Un estimador es más eficiente que otro si tiene una menor varianza (o error cuadrático medio) para el mismo tamaño de muestra.\n", | |
"\n", | |
"3. Consistencia (Consistency):\n", | |
"Un estimador $\\hat{\\theta}_n$ basado en una muestra de tamaño n es consistente si converge al verdadero valor del parámetro θ a medida que el tamaño de la muestra n tiende a infinito.\n", | |
"\n", | |
"La consistencia asegura que, con una cantidad suficientemente grande de datos, nuestro estimador estará muy cerca del valor real del parámetro.\n", | |
"Ejemplo: Bajo ciertas condiciones, la media muestral es un estimador consistente de la media poblacional (esto se relaciona con la Ley de los Grandes Números).\n", | |
"\n", | |
"\n", | |
"4. Suficiencia (Sufficiency):\n", | |
"\n", | |
"Un estadístico es suficiente si contiene toda la información relevante de la muestra para estimar el parámetro de interés. Esto significa que, una vez que conocemos el valor del estadístico suficiente, cualquier otra información adicional de la muestra no proporciona más información sobre el parámetro.\n", | |
"Formalmente, un estadístico T(X) es suficiente para un parámetro θ si la distribución condicional de la muestra X dado T(X) no depende de θ.\n", | |
"Los estimadores basados en estadísticos suficientes tienden a ser buenos estimadores.\n", | |
"\n", | |
"5. Robustez (Robustness):\n", | |
"\n", | |
"Un estimador es robusto si su rendimiento no se ve afectado significativamente por pequeñas desviaciones de los supuestos del modelo estadístico (por ejemplo, la presencia de valores atípicos o ligeras violaciones de la normalidad).\n", | |
"Los estimadores robustos son útiles en la práctica, ya que los datos reales a menudo no cumplen perfectamente los supuestos teóricos." | |
], | |
"metadata": { | |
"id": "-Y_flvVlqhGw" | |
}, | |
"id": "-Y_flvVlqhGw" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "f6fac274-4997-46e0-8bac-8c276a8a2671" | |
}, | |
"source": [ | |
"# Intervalos de Confianza" | |
], | |
"id": "f6fac274-4997-46e0-8bac-8c276a8a2671" | |
}, | |
{ | |
"cell_type": "code", | |
"execution_count": null, | |
"metadata": { | |
"id": "02db30e8-0f1b-4960-bb22-d24bc200e8e8" | |
}, | |
"outputs": [], | |
"source": [ | |
"import numpy as np\n", | |
"import matplotlib.pyplot as plt\n", | |
"import scipy.stats as st" | |
], | |
"id": "02db30e8-0f1b-4960-bb22-d24bc200e8e8" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "83757f12-3911-4534-b161-7ab242dfac79" | |
}, | |
"source": [ | |
"## Intervalo de Confianza para la media de una distribución normal (σ conocida)\n", | |
"\n", | |
"Sea $X_1, \\dots, X_n$ una m.a. $X_i \\sim \\mathcal{N}(\\mu, \\sigma^2)$. Entonces:\n", | |
"\n", | |
"- $\\bar{X} \\sim \\mathcal{N}(\\mu, \\frac{\\sigma^2}{n})$\n", | |
"- $Z = \\frac{\\bar{X} - \\mu}{\\sigma / \\sqrt{n}} \\sim \\mathcal{N}(0,1)$\n", | |
"\n", | |
"### Nivel de significancia (error): $\\alpha$\n", | |
"\n", | |
"El intervalo de confianza se basa en que:\n", | |
"$$\n", | |
"\\mathbb{P}\\left( -z_{\\alpha/2} < \\frac{\\bar{X} - \\mu}{\\sigma / \\sqrt{n}} < z_{\\alpha/2} \\right)\n", | |
"= \\mathbb{P}\\left( \\bar{X} - z_{\\alpha/2} \\frac{\\sigma}{\\sqrt{n}} < \\mu < \\bar{X} + z_{\\alpha/2} \\frac{\\sigma}{\\sqrt{n}} \\right)\n", | |
"= 1 - \\alpha\n", | |
"$$\n", | |
"\n", | |
"### El intervalo del $(1 - \\alpha) \\cdot 100\\%$ de confianza para $\\mu$ (con $\\sigma$ conocida) es:\n", | |
"\n", | |
"$$\n", | |
"\\left( \\bar{X} - z_{\\alpha/2} \\frac{\\sigma}{\\sqrt{n}}, \\quad \\bar{X} + z_{\\alpha/2} \\frac{\\sigma}{\\sqrt{n}} \\right)\n", | |
"$$\n", | |
"donde\n", | |
"\n", | |
"- $\\sigma$ = desviación estándar \n", | |
"- $\\frac{\\sigma}{\\sqrt{n}}$ = error estándar de la media \n", | |
"- $z_{\\alpha/2}$ determina el nivel de confianza \n", | |
"- El intervalo está centrado en $\\bar{X}$\n", | |
"\n", | |
"**Observación**\n", | |
"\n", | |
"- A mayor $n$, menor es el error estándar, y el intervalo de confianza es más pequeño.\n", | |
"- Esto hace que se acerque más a la media $\\mu$, es decir, que haya menor variación.\n" | |
], | |
"id": "83757f12-3911-4534-b161-7ab242dfac79" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "4167e3ab-019c-469a-8ec8-3dd4fb04fb3a" | |
}, | |
"source": [ | |
"**Ejemplo 1** Para tratar de estimar la media de consumo por cliente en un gran restaurante, se reunieron datos de una muestra de 49 clientes durante 3 semanas.\n", | |
"\n", | |
"**a)** Supongamos que la **desviación estándar de la población** es de $\\$2.50$. ¿Cuál es el error estándar de la media?\n", | |
"\n", | |
"**b)** Con un nivel de confianza del $95\\%$, ¿cuál es el margen de error?\n", | |
"\n", | |
"**c)** Si la **media de la muestra** es de $\\$22.60$, cuál es el intervalo de confianza del $95\\%$ para la media de la población?" | |
], | |
"id": "4167e3ab-019c-469a-8ec8-3dd4fb04fb3a" | |
}, | |
{ | |
"cell_type": "code", | |
"execution_count": null, | |
"metadata": { | |
"id": "8fab1175-2fdd-46cf-b5e9-afa96fd58bd8", | |
"outputId": "ce23d383-bc47-45b0-f43e-476d4308ea66" | |
}, | |
"outputs": [ | |
{ | |
"name": "stdout", | |
"output_type": "stream", | |
"text": [ | |
" a) Error estándar de la media: 0.36\n", | |
" b) Margen de error con 95% de confianza: 0.70\n", | |
" c) Intervalo de confianza del 95%: (21.90,23.30)\n" | |
] | |
} | |
], | |
"source": [ | |
"# Datos\n", | |
"n=49\n", | |
"sigma = 2.50\n", | |
"media_muestral = 22.60\n", | |
"confianza = 0.95\n", | |
"\n", | |
"# a) Error estándar de la media\n", | |
"error_estandar = sigma / np.sqrt(n)\n", | |
"#error_estandar\n", | |
"print(f\" a) Error estándar de la media: {error_estandar:.2f}\")\n", | |
"\n", | |
"# b) Margen de error\n", | |
"z = st.norm.ppf(1-(1-confianza) / 2)\n", | |
"margen_error = z * error_estandar\n", | |
"#margen_error\n", | |
"print(f\" b) Margen de error con 95% de confianza: {margen_error:.2f}\")\n", | |
"\n", | |
"# c)\n", | |
"limite_inferior = media_muestral - margen_error\n", | |
"limite_superior = media_muestral + margen_error\n", | |
"print(f\" c) Intervalo de confianza del 95%: ({limite_inferior:.2f},{limite_superior:.2f})\")" | |
], | |
"id": "8fab1175-2fdd-46cf-b5e9-afa96fd58bd8" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "355a09d1-ea4b-4bca-8687-634b9a711160" | |
}, | |
"source": [ | |
"$1-\\alpha=.95$, implica que $z_{\\alpha/2} = z_{0.025} = 1.96$" | |
], | |
"id": "355a09d1-ea4b-4bca-8687-634b9a711160" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "84d9699b-83a4-41ee-ab46-971262070bde" | |
}, | |
"source": [ | |
"**Ejemplo 2** Supongamos que se toma una muestra aleatoria de 100 personas para estimar la media del peso de una población, y se obtiene que la media muestral es de $70$ kg con una desviación estándar que es conocida de $10$ kg. Para un nivel de confianza del $95\\%$, calcular el intervalo de confianza" | |
], | |
"id": "84d9699b-83a4-41ee-ab46-971262070bde" | |
}, | |
{ | |
"cell_type": "code", | |
"execution_count": null, | |
"metadata": { | |
"id": "bc091cc7-4fc7-4d23-ae93-9c058c82d073", | |
"outputId": "b43b8dfb-f64e-4eae-bf50-0296e7de0c90" | |
}, | |
"outputs": [ | |
{ | |
"name": "stdout", | |
"output_type": "stream", | |
"text": [ | |
"Intervalo de confianza del 95% es: (68.04003601545995, 71.95996398454005)\n" | |
] | |
} | |
], | |
"source": [ | |
"# Datos\n", | |
"n = 100\n", | |
"media_muestral = 70\n", | |
"sigma = 10\n", | |
"nivel_confianza = 0.95\n", | |
"error_estandar = sigma / np.sqrt(n)\n", | |
"\n", | |
"#Utilizaremos la función scipy.stats.norm.interval\n", | |
"# Sintaxis\n", | |
"# scipy.stats.norm.interval(confidence, loc = media, scale = error_estandar )\n", | |
"\n", | |
"intervalo = st.norm.interval(confidence = nivel_confianza, loc = media_muestral, scale = error_estandar)\n", | |
"print(f\"Intervalo de confianza del 95% es: {intervalo}\")\n" | |
], | |
"id": "bc091cc7-4fc7-4d23-ae93-9c058c82d073" | |
}, | |
{ | |
"cell_type": "code", | |
"execution_count": null, | |
"metadata": { | |
"id": "cb7790f8-3bb4-4e42-b70b-92c2897699a3", | |
"outputId": "2ba1b952-f8d7-42a1-bb47-68b2e3dd1ce1" | |
}, | |
"outputs": [ | |
{ | |
"data": { | |
"image/png": "", | |
"text/plain": [ | |
"<Figure size 1000x500 with 1 Axes>" | |
] | |
}, | |
"metadata": {}, | |
"output_type": "display_data" | |
} | |
], | |
"source": [ | |
"# Puntos para graficar la curva normal\n", | |
"x = np.linspace(media_muestral - 4*error_estandar, media_muestral + 4*error_estandar, 500)\n", | |
"y = st.norm.pdf(x, loc=media_muestral, scale=error_estandar)\n", | |
"\n", | |
"# Gráfica\n", | |
"plt.figure(figsize=(10, 5))\n", | |
"plt.plot(x, y, label='Distribución normal', color='black')\n", | |
"\n", | |
"# Sombrear el intervalo de confianza\n", | |
"plt.fill_between(x, y, where=(x >= intervalo[0]) & (x <= intervalo[1]), color='skyblue', alpha=0.6, label='IC 95%')\n", | |
"\n", | |
"# Líneas verticales\n", | |
"plt.axvline(intervalo[0], color='blue', linestyle='--', label=f'IC inferior = {intervalo[0]:.2f}')\n", | |
"plt.axvline(intervalo[1], color='blue', linestyle='--', label=f'IC superior = {intervalo[1]:.2f}')\n", | |
"plt.axvline(media_muestral, color='red', linestyle='-', label=f'Media muestral = {media_muestral}')\n", | |
"\n", | |
"plt.title('Intervalo de confianza del 95% para la media ($\\\\sigma$ conocida)', fontsize=14)\n", | |
"plt.xlabel('Valor de la variable')\n", | |
"plt.ylabel('Densidad')\n", | |
"plt.legend()\n", | |
"plt.grid(True)\n", | |
"plt.show()" | |
], | |
"id": "cb7790f8-3bb4-4e42-b70b-92c2897699a3" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "5d7ff38c-23bf-47af-83ce-74186a9c4885" | |
}, | |
"source": [ | |
"## Intervalo de Confianza para la media $\\mu$ de una distribución normal ($\\sigma$ deconocida)\n", | |
"\n", | |
"Sea $X_1, \\dots, X_n$ una m.a. $X_i \\sim \\mathcal{N}(\\mu, \\sigma^2)$. Entonces:\n", | |
"\n", | |
"- $\\bar{X} \\sim \\mathcal{N}(\\mu, \\frac{\\sigma^2}{n})$\n", | |
"- $Z = \\frac{\\bar{X} - \\mu}{\\sigma / \\sqrt{n}} \\sim \\mathcal{N}(0,1)$\n", | |
"\n", | |
"Si el tamaño de la muestra es menor a 30, se utiliza la $t$:\n", | |
"### Estadístico t\n", | |
"\n", | |
"Definimos el estadístico $t$ de la siguiente manera:\n", | |
"$$T = \\frac{\\bar{X}-\\mu}{s/\\sqrt{n}} \\sim t_{(n-1)} $$\n", | |
"\n", | |
"### El intervalo del $(1 - \\alpha) \\cdot 100\\%$ de confianza para $\\mu$ (con $\\sigma$ desconocida) es:\n", | |
"\n", | |
"$$\n", | |
"\\left( \\bar{X} - t_{\\alpha/2} \\frac{s}{\\sqrt{n}}, \\quad \\bar{X} + t_{\\alpha/2} \\frac{s}{\\sqrt{n}} \\right)\n", | |
"$$\n", | |
"donde\n", | |
"\n", | |
"- $s$ = desviación estándar muestral\n", | |
"- $\\frac{s}{\\sqrt{n}}$ = error estándar de la media \n", | |
"- $t_{\\alpha/2}$ determina el nivel de confianza \n", | |
"- El intervalo está centrado en $\\bar{X}$" | |
], | |
"id": "5d7ff38c-23bf-47af-83ce-74186a9c4885" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "53098df6-c305-4816-8917-a379c4dbb64b" | |
}, | |
"source": [ | |
"**Ejemplo 3** Supongamos que tenemos los siguientes datos\n", | |
"$$ datos = [45, 55, 67, 45, 68, 79, 98, 87, 84, 82] $$\n", | |
"Calcular un intervalo de confianza para la media." | |
], | |
"id": "53098df6-c305-4816-8917-a379c4dbb64b" | |
}, | |
{ | |
"cell_type": "code", | |
"execution_count": null, | |
"metadata": { | |
"id": "f411d521-67c2-4cf4-a61c-1283ee39f5dc", | |
"outputId": "4b5ecf4a-8373-4ff8-a166-fc63a9ab473a" | |
}, | |
"outputs": [ | |
{ | |
"name": "stdout", | |
"output_type": "stream", | |
"text": [ | |
"Media muestral: 71.00\n", | |
"Error estandar: 5.75\n", | |
"El intervalo de confianza del 95% es: (58.000521742293884, 83.99947825770612)\n" | |
] | |
} | |
], | |
"source": [ | |
"# Datos del ejemplo\n", | |
"data = [45, 55, 67, 45, 68, 79, 98, 87, 84, 82]\n", | |
"confidence = 0.95\n", | |
"gl = len(data) - 1 # grados de liber\n", | |
"\n", | |
"# Media y error estandar\n", | |
"mean = np.mean(data)\n", | |
"error_est = st.sem(data)\n", | |
"\n", | |
"# Intervalo de confianza usando t de Student\n", | |
"intervalo = st.t.interval(confidence, gl, loc = mean, scale = error_est)\n", | |
"\n", | |
"print(f\"Media muestral: {mean:.2f}\")\n", | |
"print(f\"Error estandar: {error_est:.2f}\")\n", | |
"print(f\"El intervalo de confianza del 95% es: {intervalo}\")\n" | |
], | |
"id": "f411d521-67c2-4cf4-a61c-1283ee39f5dc" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "62e514a4-e078-4161-9f67-7623da916d34" | |
}, | |
"source": [ | |
"**Ejemplo 4** Los artículos de cerámica utilizados sobre velas electricas sobrecargadas se rompen con diferentes presiones. Supongamos que los datos provienen de una distribución normal.\n", | |
"\n", | |
"La resistencia a la ruptura fue medida en una muestra de 100 artículos, y el promedio fue de $1750$ con un desviación estándar de 315.8\n", | |
"\n", | |
"**a)** Estimar con un nivel del confianza del $90\\%$ a la media poblacional de la presión de la ruptura.\n", | |
"\n", | |
"**b)** Estimar con un nivel del confianza del $90\\%$ a la varianza poblacional." | |
], | |
"id": "62e514a4-e078-4161-9f67-7623da916d34" | |
}, | |
{ | |
"cell_type": "code", | |
"execution_count": null, | |
"metadata": { | |
"id": "c1f0631a-ec18-4f2a-99d2-5da5c180ef34", | |
"outputId": "c3dac233-e743-4580-b1f7-09837f3942d9" | |
}, | |
"outputs": [ | |
{ | |
"name": "stdout", | |
"output_type": "stream", | |
"text": [ | |
"El intervalo de confianza del 90% es: (1698.0555224608725, 1801.9444775391275)\n", | |
"El intervalo de confianza del 90% es: (80123.48643850331, 128146.71537457063)\n", | |
"El intervalo de confianza del 90% es: (80123.48643850331, 128146.71537457063)\n" | |
] | |
} | |
], | |
"source": [ | |
"from scipy.stats import chi2\n", | |
"# datos\n", | |
"n = 100\n", | |
"media_muestral = 1750\n", | |
"desv_estandar_muestral = 315.8\n", | |
"confianza = 0.90\n", | |
"\n", | |
"# a) Usar la normal ya que el tamaño de la muestra es grande\n", | |
"error_est = desv_estandar_muestral / np.sqrt(n)\n", | |
"error_est\n", | |
"intervalo_media = st.norm.interval(confidence=confianza, loc = media_muestral, scale = error_est)\n", | |
"print(f\"El intervalo de confianza del 90% es: {intervalo_media}\")\n", | |
"\n", | |
"# b) Intervalo de confianza para la varianza (usar chi-cuadrada)\n", | |
"alpha = 1-confianza\n", | |
"gl = n-1\n", | |
"s2 = desv_estandar_muestral**2\n", | |
"\n", | |
"#Cuantiles de la chi-cuadrada\n", | |
"chi2_inf = st.chi2.ppf(alpha / 2,df=gl)\n", | |
"chi2_sup = st.chi2.ppf(1- alpha / 2,df=gl)\n", | |
"\n", | |
"# Intervalo de confianza\n", | |
"intervalo_varianza = ((gl * s2) / chi2_sup, (gl * s2) / chi2_inf )\n", | |
"print(f\"El intervalo de confianza del 90% es: {intervalo_varianza}\")\n", | |
"\n", | |
"#Otra forma\n", | |
"chi2_low, chi2_high = chi2.interval(confianza,df=gl)\n", | |
"intervalo_varianza1 = ((gl * s2) / chi2_high, (gl * s2) / chi2_low )\n", | |
"print(f\"El intervalo de confianza del 90% es: {intervalo_varianza1}\")\n" | |
], | |
"id": "c1f0631a-ec18-4f2a-99d2-5da5c180ef34" | |
}, | |
{ | |
"cell_type": "markdown", | |
"metadata": { | |
"id": "83178f8c-3f3f-4d0e-9a18-b46884bb5a4c" | |
}, | |
"source": [ | |
"**Ejemplo** El artículo *\"Evaluation of a Ventilation Strategy to Prevent Barotrauma in Patients at High Risk for Acute Respiratory Distress Syndrome\"* reportó sobre un experimento con 120 pacientes con anestesistas en cuidados intensivos (UCI), los cuales fueron divididos al azar en dos grupos, donde cada uno esta compuesto por 60 pacientes.\n", | |
"\n", | |
"- Grupo A: promedio de permanencia = 14.1 horas\n", | |
"- Grupo B: promedio de permanencia = 17.5 horas\n", | |
"- Desviación estándar en ambos = 5.1 hrs\n", | |
"\n", | |
"Encontrar un intervalo del $95\\%$ de confianza para la diferecia de medias poblacionales: $(\\mu_A - \\mu_B)$ " | |
], | |
"id": "83178f8c-3f3f-4d0e-9a18-b46884bb5a4c" | |
}, | |
{ | |
"cell_type": "code", | |
"execution_count": null, | |
"metadata": { | |
"id": "4f710ffd-16aa-4205-b47a-c3f2c6a95648", | |
"outputId": "64f32f7b-f82b-4b74-fc93-cd2b2e3fee4e" | |
}, | |
"outputs": [ | |
{ | |
"name": "stdout", | |
"output_type": "stream", | |
"text": [ | |
"Diferencia de las medias: -3.40\n", | |
"Intervalo de confianza del 95%: (-5.22,-1.58)\n" | |
] | |
} | |
], | |
"source": [ | |
"#Datos\n", | |
"n1 = 60\n", | |
"n2 = 60\n", | |
"media1 = 14.1\n", | |
"media2 = 17.5\n", | |
"sigma = 5.1\n", | |
"confianza = 0.95\n", | |
"alpha = 1-confianza\n", | |
"#gl = n1 + n2 -2\n", | |
"\n", | |
"#valor critico\n", | |
"z = st.norm.ppf(1 - alpha / 2)\n", | |
"\n", | |
"#Error estandar\n", | |
"error_est = sigma * np.sqrt(1/n1 + 1/n2)\n", | |
"dif_medias = media1 - media2\n", | |
"margen_error = z *error_est\n", | |
"\n", | |
"lim_inf = dif_medias - margen_error\n", | |
"lim_sup = dif_medias + margen_error\n", | |
"print(f\"Diferencia de las medias: {dif_medias:.2f}\")\n", | |
"print(f\"Intervalo de confianza del 95%: ({lim_inf:.2f},{lim_sup:.2f})\")" | |
], | |
"id": "4f710ffd-16aa-4205-b47a-c3f2c6a95648" | |
} | |
], | |
"metadata": { | |
"kernelspec": { | |
"display_name": "Python [conda env:base] *", | |
"language": "python", | |
"name": "conda-base-py" | |
}, | |
"language_info": { | |
"codemirror_mode": { | |
"name": "ipython", | |
"version": 3 | |
}, | |
"file_extension": ".py", | |
"mimetype": "text/x-python", | |
"name": "python", | |
"nbconvert_exporter": "python", | |
"pygments_lexer": "ipython3", | |
"version": "3.12.7" | |
}, | |
"colab": { | |
"provenance": [], | |
"include_colab_link": true | |
} | |
}, | |
"nbformat": 4, | |
"nbformat_minor": 5 | |
} |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment