Skip to content

Instantly share code, notes, and snippets.

@cdiener
Last active November 9, 2017 04:25
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save cdiener/84dae5658d3e7696e652b6e6106b8acf to your computer and use it in GitHub Desktop.
Save cdiener/84dae5658d3e7696e652b6e6106b8acf to your computer and use it in GitHub Desktop.
Como instalar docker para la clase de Desafio LatAm.

Instalación de Docker

Lo primero que tienes que saber sobre la instalación de docker es que para Mac y windows hay dos versiones de docker:

  1. una versión legacy que usa maquinas virtuales (VM) para correr docker adentro de una maquina virtual.
  2. una versión nativa que usa una capa de compatibilidad (HyperKit + Hypervisor en Mac y Hyper-V en Windows) para correr docker directamente con el kernel nativo

La versión nativa (opción 2) tiene menos overhead y corre más rapido pero pone mas restricciones a su OS. Por el momento yo recomiendo que usan esta versión en Mac y Linux y la version legacy (opcion 1) en Windows.

Para Mac

Si tienen al menos OS X El Capitan (10.11) pueden correr la versión nativa.

Instrucciones de instalación

Sí tienen una versión anterior de OSX (<10.11) pueden correr docker en una maquina virtual usando el Docker Toolbox.

Para ver si funcionó bien su instalación y ajustar la configuración como por ejemplo la cantidad de CPUs y RAM que puede usar docker pueden seguir la guía de Getting started.

Para Windows

Se recomienda instalar docker usando Docker Toolbox.

Instrucciones de instalación

Si tienen una versión 64bit de Windows 10 Pro, Enterprise o Education también pueden instalar la versión nativa para Windows (instrucciones) pero tomen en cuenta que esto activará Hyper-V y en consecuencia Virtual Box ya no funcionará en su equipo.

Para ver si funcionó bien su instalación y ajustar la configuración como por ejemplo la cantidad de CPUs y RAM que puede usar docker pueden seguir la guía de Getting started.

Para Ubuntu

Docker siempre corre nativo en Linux. Para la instalación tienen que agregar el repositorio de Docker.

Instrucciones de instalación

Por default los comandos de docker van a requerir derechos de root y se tienen que correr con sudo. Pueden seguir las intrucciones aquí para cambiar esto.

Diferencias entre versiones de VM y nativas

Para seguir la clase las diferencias principales son las siguientes:

  • Para la version nativa se corren los comandos de docker en su Shell local (terminal para Mac y Ubuntu, CMD o PowerShell para Windows) mientras para la version de VM (Docker Toolbox) se corren los comandos de docker en el Shell de Docker Toolbox.
  • Para la versión nativa docker usa la red del host entonces direcciones como localhost en los tutoriales corresponden al localhost de su maquina. Para la version de VM (Docker Toolbox) la VM tiene su propio IP que normalmente se muestra cuando inician el Shell de la Toolbox. Siempre cuando se menciona un IP como localhost o 127.0.0.1 en un tutorial lo tienen que sustituir por esta IP propia.
  • El mapeo de volúmenes en la version de Docker Toolbox no funciona como en la versión nativa y requiere más configuración (para Windows y para Mac)

Cómo seguir desde aquí

Si quieren aprender más sobre docker pueden seguir un mini curso que dí en 2017:

Mini curso (ingles)

Imágenes para la clase

Para la clase usamos las imágenes de Hadoop y de PySpark Notebook. Porque estas imágenes son grandes ayuda que las descarguen antes de la clase. Pueden usar los siguientes comandos de docker:

docker pull cdiener/hadoop
docker pull jupyter/pyspark-notebook

Así ya tienen las imágenes en su máquina para la clase.

Opcionalmente también pueden registrarse en Cloudera para obtener la imagen de Quickstart que es una distribución completa para Big Data. Tomen en cuenta que necesitan al menos 10GB de RAM libres y un CPU i7 o equivalente para esta imagen.

Cloudera quickstart VMs

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment