Skip to content

Instantly share code, notes, and snippets.

Exercice : (5 points)

  1. Décrire le principe du modèle de traitement MapReduce :

    Le modèle de traitement MapReduce est conçu pour traiter de grandes quantités de données en parallèle sur des clusters de serveurs. Il comporte deux phases principales :

    • Map : Chaque élément d’entrée est traité par une fonction map qui génère des paires clé-valeur intermédiaires.
    • Shuffle and Sort : Les paires intermédiaires sont réparties et triées par clé.
    • Reduce : Les paires triées sont traitées par une fonction reduce pour produire les résultats finaux.

Vagrant Setup for Docker, Git, NVM, and Node.js

This Vagrant setup provides a quick way to provision a virtual machine with Docker, Git, NVM (Node Version Manager), and Node.js installed.

Prerequisites

  1. Create a Vagrantfile

1. Avantages de l'utilisation du Big Data :

  • Capacité à traiter et analyser de grandes quantités de données rapidement.
  • Possibilité d'extraire des informations précieuses à partir de données hétérogènes et non structurées.
  • Permet de prendre des décisions basées sur des données en temps réel, améliorant ainsi la réactivité et la pertinence des actions.

2. Comparaison entre Apache Hadoop et le SGBD relationnel :

  • Apache Hadoop est conçu pour le traitement distribué de données massives non structurées, tandis que les SGBD relationnels sont optimisés pour le stockage et la requête de données structurées dans un environnement centralisé.
  • Hadoop utilise un modèle de stockage distribué (HDFS) pour la persistance des données, tandis que les SGBD relationnels utilisent des tables avec un schéma prédéfini.
  1. Open a terminal in the Linux virtual machine and create a directory to serve as the cage:
mkdir cage
  1. Add a "secret" file containing some text to the created directory:
echo "firas_password" > cage/secret
@Firas-Ruine
Firas-Ruine / summary.md
Created January 12, 2024 21:52
Summary for the LPI 102 exam

Chapitre 5

Add Group

groupadd <group_name>

Verify Group Existence

@Firas-Ruine
Firas-Ruine / logs.md
Created January 7, 2024 14:56
This Gist provides insights into understanding and effectively managing logs on a Linux system. Logs are crucial for monitoring system health, diagnosing issues, and maintaining security. Learn about various log files, their formats, and how to navigate and analyze them.

Linux Logs Traceability Management

Introduction

In a Linux environment, logs play a crucial role in system monitoring, debugging, and security. Managing logs effectively helps trace and analyze system events. This guide covers essential aspects of Linux logs traceability management.

Types of Logs

@Firas-Ruine
Firas-Ruine / cron-jobs.md
Created January 7, 2024 14:55
This Gist serves as a guide to understanding and effectively managing Cron jobs on a Linux system. Cron is a time-based job scheduler that allows users to automate repetitive tasks, such as running scripts, commands, or programs, at scheduled intervals.

Cron Job Management Commands

  • List Cron Jobs

    crontab -l
  • Open Cron Jobs Editor

@Firas-Ruine
Firas-Ruine / users-and-groups-management.md
Created January 7, 2024 14:54
This Gist provides a comprehensive guide on managing users and groups in a Linux environment. Understanding and effectively managing users and groups is crucial for maintaining system security, access control, and overall system administration.

Add Group

groupadd <group_name>

Verify Group Existence

grep  /etc/group