Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save matiasvallejosdev/3c73e829890e027a3045c319d85f718a to your computer and use it in GitHub Desktop.
Save matiasvallejosdev/3c73e829890e027a3045c319d85f718a to your computer and use it in GitHub Desktop.
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de una variable. En otras palabras, las medidas de dispersión son números que indican si una variable se mueve mucho, poco, más o menos que otra. La razón de ser de este tipo de medid…
import numpy as np
import pandas as pd
edad = pd.array([16,16,16,17,17,17,17,17,17,18,18,18,19,20])
lenArray = len(edad)
media = np.sum(edad) / len(edad) # np.mean(array)
mediana = 17 # np.median(array)
moda = 17
print("Cantidad de datos:", lenArray)
print("Media edad:", media)
print("Mediana edad:", mediana)
print("Moda edad:", moda)
# x = max - min
rango = 20 - 16
# x = (x - m)2 / q
varianza = np.sum(np.square(edad - media)) / lenArray # np.var(array)
# x = _/varianza
desviacionEstandar = np.sqrt(varianza) # np.mean(array)
# x = desviacionEstandar / media
coeficienteVariacion = (desviacionEstandar / media) * 100
print("Rango edad:", rango)
print("Desviacion estandar edad:", desviacionEstandar)
print("Varianza edad:", varianza)
print("Coeficiente variacion: " + str(coeficienteVariacion) + "%")
@matiasvallejosdev
Copy link
Author

Principales medidas de dispersión

Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y el coeficiente de variación (no confundir con coeficiente de determinación). A continuación veremos estas cuatro medidas.

Rango

El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una población o muestra estadística. Su fórmula es:

R = Máxx – Mínx

Donde:

R → Es el rango.
Máx → Es el valor máximo de la muestra o población.
Mín → Es el valor mínimo de la muestra o población estadística.
x → Es la variable sobre la que se pretende calcular esta medida.

Varianza

La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones. Su fórmula es la siguiente:

Varianza Formula

X → Variable sobre la que se pretenden calcular la varianza
xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
N → Número de observaciones.
x̄ → Es la media de la variable X.

Desviación típica

La desviación típica es otra medida que ofrece información de la dispersión respecto a la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz cuadrada de su resultado. Es decir, la desviación típica es la raíz cuadrada de la varianza.

Formula Desviacion Tipica

X → Variable sobre la que se pretenden calcular la varianza
xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
N → Número de observaciones.
x̄ → Es la media de la variable X.

Coeficiente de variación

Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión.

Coeficiente De Variacion:

X → Variable sobre la que se pretenden calcular la varianza
σx → Desviación típica de la variable X.
| x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment