On organise la restitution en même temps que le kickoff ElasticSearch le 07/01 ?
Classification des contenus par thème "ePoseidon" en utilisant la citation d'articles, méthode qui performe mieux que le NLP dans les expériences menées. Plus d'exploration et de données nécessaires pour améliorer les résultats.
A tester : En ajoutant du "word embedding" sur les contenus en "language naturel" qu'on peut extraire car liés par un même thème (faq, titres des fiches), on pourrait rapprocher un texte libre de contenus sémantiquements proches.
Techniquement, le word embedding pourrait intervenir ici, juste avant la requete Elastic : un script permettrait d'utiliser une liste de mots/expressions proches avec des weights au lieu d'une seule valeur.
Algorithme qui permet de classifier une question dans un des scénarii définis dans l'excel des scénarios, qui correspond à un thème ePoseidon et permet de proposer des résultats classifiés dans ce thème.
Implementé séparement dans une API python
- Il faut encore du travail côté métier pour affiner le tableau et l'agorithme avant d'intégrer ce travail dans le front. Objectifs ?.
- Le tableau peut être enrichi avec d'autres colonnes. ex: hierarchie des normes à appliquer, filtres ES...
Pour l'instant la recherche utilise Elastic Search donc il faudrait également ajouter du "Word Embedding" pour pouvoir faire de la recherche sémantique.