Last active
April 7, 2021 15:50
-
-
Save matiasvallejosdev/3c73e829890e027a3045c319d85f718a to your computer and use it in GitHub Desktop.
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de una variable. En otras palabras, las medidas de dispersión son números que indican si una variable se mueve mucho, poco, más o menos que otra. La razón de ser de este tipo de medid…
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
import numpy as np | |
import pandas as pd | |
edad = pd.array([16,16,16,17,17,17,17,17,17,18,18,18,19,20]) | |
lenArray = len(edad) | |
media = np.sum(edad) / len(edad) # np.mean(array) | |
mediana = 17 # np.median(array) | |
moda = 17 | |
print("Cantidad de datos:", lenArray) | |
print("Media edad:", media) | |
print("Mediana edad:", mediana) | |
print("Moda edad:", moda) | |
# x = max - min | |
rango = 20 - 16 | |
# x = (x - m)2 / q | |
varianza = np.sum(np.square(edad - media)) / lenArray # np.var(array) | |
# x = _/varianza | |
desviacionEstandar = np.sqrt(varianza) # np.mean(array) | |
# x = desviacionEstandar / media | |
coeficienteVariacion = (desviacionEstandar / media) * 100 | |
print("Rango edad:", rango) | |
print("Desviacion estandar edad:", desviacionEstandar) | |
print("Varianza edad:", varianza) | |
print("Coeficiente variacion: " + str(coeficienteVariacion) + "%") |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Principales medidas de dispersión
Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y el coeficiente de variación (no confundir con coeficiente de determinación). A continuación veremos estas cuatro medidas.
Rango
El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una población o muestra estadística. Su fórmula es:
R = Máxx – Mínx
Donde:
Varianza
La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones. Su fórmula es la siguiente:
Varianza Formula
Desviación típica
La desviación típica es otra medida que ofrece información de la dispersión respecto a la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz cuadrada de su resultado. Es decir, la desviación típica es la raíz cuadrada de la varianza.
Formula Desviacion Tipica
Coeficiente de variación
Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión.
Coeficiente De Variacion: