Skip to content

Instantly share code, notes, and snippets.

@Whistler092
Last active April 21, 2017 21:47
Show Gist options
  • Save Whistler092/61cb8c855cdb5df082d79790c4cb212b to your computer and use it in GitHub Desktop.
Save Whistler092/61cb8c855cdb5df082d79790c4cb212b to your computer and use it in GitHub Desktop.
Temas a estudiar para entender a los SRE

Algunos tópicos en los que se deben tener nociones para SRE (Site reliability engineering) son:

  • networking: routing, switching, packet filtering, DNS, load balancing en capa 4 y 7 del modelo TCP/IP
  • shell scripting en Bash
  • kernel: memory management, process management, scheduler, syscalls, VFS, cgroups, namespaces, booting, etc
  • Conocimientos fuertes en HTTP y TCP y nociones sobre como funcionan los browsers en todas las capas.
  • Nociones básicas sobre algoritmos de compresión
  • Conocimientos sobre sistemas distribuidos, algoritmos de consenso y coordinación como Raft, Zab y Paxos.
    • Y los sistemas que los usan: etcd, consul, Docker swarm, zookeeper.
    • La idea es que pueda entender cómo recuperar y escalar esos sistemas.
  • Conocimientos sobre monitoreo y métricas útiles en sistemas distribuidos. Histogramas, 9x percentiles, mean, media, etc
  • Habilidades de troubleshooting con perf tools: ebpf, iperf, netstat, tcpdump, pidstat, ethtool, etc

Habilidades

  • SREs tiene que ser muy buenos también en ingeniería de software
  • Son personas que saben sobre IT y sobre software, muy profundamente.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment