Skip to content

Instantly share code, notes, and snippets.

@MaximePawlakFr
Created June 2, 2017 07:19
Show Gist options
  • Save MaximePawlakFr/94a59e78b4038bf9da7cad2c1fd36a23 to your computer and use it in GitHub Desktop.
Save MaximePawlakFr/94a59e78b4038bf9da7cad2c1fd36a23 to your computer and use it in GitHub Desktop.

Au printemps 2016, Leonardo Noleto, à l’époque président de l’association Toulouse Data Science (un groupe meetup très productif et super sympa), annonçait qu’il partait de Toulouse pour Paris #sniff. Après pas mal de discussions sur “j’ai envie de tester la (… attention buzzword is coming…) Data Science, de voir concrètement ce que fait un (… buzzword is coming again…) Data Scientist au jour le jour afin de, pourquoi pas, envisager de travailler dans ce domaine”.

“Métier le plus sexy du 21ème siècle” qu’ils disaient.

Le meetup Toulouse Data Science : TDS

Leonardo me dirige donc vers un MOOC (Massive Online Open Course, un cours sur un internet) très populaire et très bien ficelé par le MIT (une petite université du Massachusetts) : The Analytics Edge.

Try n°1

En juin 2016, je me plonge dedans. J’y consacre 1h30 tous les matins avant de partir travailler (j’étais dans ma dynamique de Morning Routine). Le moins que l’on puisse dire est que c’était un sacré morceau ! Il me fallait 3–4 jours pour terminer une Unit (sur un total de 9 Units). Et comme l’été est arrivé (encore une fois par surprise), j’ai interrompu le Mooc, en me disant que je reprendrais à la rentrée.

A la rentrée, le travail a repris, le Mooc est restait en pause. Summer 1–0 Maxime

9 mois de pause. Est-ce que j’attendais un enfant ? Pas du tout, je me suis laissé déborder par mille autres projets #stripio.

Try again

Depuis quelques jours, j’ai un peu plus de temps libre. J’ai demandé à la nouvelle présidente du Toulouse Data Science, Alexia Audevart, des conseils sur le “comment mettre le pied à l’étrier de la Data Science ?” (je sais, je demande souvent conseil, parfois les mêmes). Naturellement, elle me dit : “le Mooc : The Analytics Edge !”

Je vais donc profiter de mes disponibilités pour revenir dessus et terminer ce que j’avais commencé. Nous sommes début juin 2017, et je vais me remettre sur ce Mooc, depuis 0. Pimentons les choses …

Pour m’aider à prendre du recul et rendre mon apprentissage un peu plus piquant (et efficace), je me suis imposé l’écriture et le partage de mon aventure via des posts de blog comme celui-ci. Je n’ai pas la prétention de vous restituer intégralement le cours, ou encore de faire une synthèse du cours. C’est avant tout personnel. Je vais me servir de ces posts pour relativiser ce que j’apprends et vérifier mes connaissances (le mode QCM est très rassurant, trop à mon goût !).

“Tell me and I forget, teach me and I may remember, involve me and I learn.”
Benjamin Franklin

Le cours en question est un cours disponible (ou était?) sur edX : MITx: 15.071x The Analytics Edge Interface d’edX sur le cours MIT 15.071x The Analytics Edge Déroulé du Mooc

Le cours est divisé en 9 Units qui abordent chacune une nouvelle notion :

Introduction to R and Basic Data Analysis
Linear Regression
Logistic Regression
Trees
Text Analytics
Clustering
Visualization
Linear Optimization
Integer Optimization

Chaque Unit se déroule de manière très didactique. Une explication théorique des outils, plusieurs cas concrets d’applications guidés par le “prof” (une “Recitation”) et des “Assignments” en autonomie sur des cas concrets avec un questionnaire. Let’s get started !

Je présenterai dans les futurs posts les nouvelles notions vues ainsi que les différentes problématiques traitées. Surtout, si je dis des bêtises ou trop d’approximations, vous êtes fortement invités à me faire un retour !

Sur ce, je vous dis à bientôt pour la première Unit.

La bise

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment