Skip to content

Instantly share code, notes, and snippets.

@revolunet
Last active December 21, 2018 20:41
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save revolunet/f29b7399994d217d43e3cf34bc2c1ca9 to your computer and use it in GitHub Desktop.
Save revolunet/f29b7399994d217d43e3cf34bc2c1ca9 to your computer and use it in GitHub Desktop.
brief ES 10/12/18

Code du travail numérique

Un produit existe déjà sur http://codedutravail-dev.num.social.gouv.fr

Documentation & sources : https://github.com/SocialGouv/code-du-travail-numerique

Nous utilisons ElasticSearch pour ingérer les données publiques issues de différentes sources.

Recap issues ES dans SocialGouv/code-du-travail-numerique#405

Source Documents
KALI 351
IDCC 844
code du travail 10948
fiches service public 678
fiches min.travail 822
faq 105
faq CC 46
courriers 6
outils 1
TOTAL 13839

Côté Dev

Le setup est expliqué dans le README du projet. Il faut initialiement lancer une commande pour indexer les données dans ElasticSearch. Les données sont incluses dans le projet: cf dataset.

  • Le front est en ReactJS / Next.js
  • Une API en NodeJS traite les requêtes de l'UI et interroge Elastic search.
  • Un script Python traite plusieurs fichiers JSON/CSV, crée l'index ES et indexe les documents.

Mission

  • Audit/Conseil sur l'index et architecture actuels
  • Correction de problèmes de pertinence/tuning identifiés : cf GitHub
  • Conseil sur une architecture plus scalable/résiliente et sécurisée

Travaux récents

Recherches NLP vec Onogone : https://gist.github.com/revolunet/bcc2fe58d5bb2199d2745b538f210dda

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment