Last active
October 12, 2018 13:58
-
-
Save deybvagm/72c44be5463d8869ceb717951540ffd8 to your computer and use it in GitHub Desktop.
Loads cats dataset from HDF5 format
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
def load_dataset(): | |
train_dataset = h5py.File('dataset/train_catvnoncat.h5', "r") | |
train_set_x_orig = np.array(train_dataset["train_set_x"][:]) # your train set features | |
train_set_y_orig = np.array(train_dataset["train_set_y"][:]) # your train set labels | |
test_dataset = h5py.File('dataset/test_catvnoncat.h5', "r") | |
test_set_x_orig = np.array(test_dataset["test_set_x"][:]) # your test set features | |
test_set_y_orig = np.array(test_dataset["test_set_y"][:]) # your test set labels | |
classes = np.array(test_dataset["list_classes"][:]) # the list of classes | |
train_set_y_orig = train_set_y_orig.reshape((1, train_set_y_orig.shape[0])) | |
test_set_y_orig = test_set_y_orig.reshape((1, test_set_y_orig.shape[0])) | |
return train_set_x_orig, train_set_y_orig, test_set_x_orig, test_set_y_orig, classes |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
train_set_x_orig, train_set_y, test_set_x_orig, test_set_y, classes = load_dataset() | |
index = 25 | |
plt.imshow(train_set_x_orig[index]) | |
plt.show() |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
La función
load_dataset
carga un le conjunto de datos en memoria, asumiendo que los datos están en un directorio llamado 'dataset'. Una imagen desde el punto de vista del código, no es más que un array de números. En nuestro caso, es un array multidimensional, cuyas dimensiones son (64, 64, 3) dado que cada imagen es de 64x64 pixeles y están en formato RGB, por lo tanto tienen 3 canales que corresponden a Rojo, Verde y Azul (RGB). Esto explica el por qué de las dimensiones del array. Además la función retorna varios elementos, en este caso para hacer el entrenamiento son necesariostrain_set_x_orig
ytrain_set_y
El archivo
print_image_example.py
lo que hace es llamar la funciónload_dataset
y mostrar una de las imágenes en pantalla, en este caso la que está en el index 25 del array. Puedes cambiar el index para explorar diferentes imágenesLas librerías que deben tener instaladas son
matplotlib
,numpy
yh5py
Ejemplo de como instalar
pip install numpy