Skip to content

Instantly share code, notes, and snippets.

@JhonatanHern
Last active September 19, 2019 19:01
Show Gist options
  • Save JhonatanHern/2afd54bdf0ca723c98dec52bcefa2b34 to your computer and use it in GitHub Desktop.
Save JhonatanHern/2afd54bdf0ca723c98dec52bcefa2b34 to your computer and use it in GitHub Desktop.
- - - - - - - - - - - - - - - - - Particionamiento
Se suelen usar distancias estilo euclideana, Manhattan o Minkowski.
Se generan particiones (asignar etiquetas a un area) similares a "nubes"
Cada nube tiene un "centroide"
Se usan dos distancias:
Distancia Inte-cluster
Distancia Intra-cluster
Un algoritmo usado es el de k-means. Este requiere una función para sacar el promedio de un conjunto de observaciones y
un límite de iteraciones. Es sensible a valores anómalos, sólamente detecta esferoides y es bastante costoso computacionalmente.
K-moda es igual, pero usael valor mas repetido como centroide en vez de el promedio.
K-medioides usa puntos existentes en el conjunto como centroides originales
- - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - Jerarquía
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Densidad
radio
#participantes
alcanzable por densidad
DBSCAN
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Plantillas
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment