Les grands modèles de langage pour le traitement des données non structurées
Aujourd’hui, la majorité des documents ne sont pas structurés, ce qui rend les processus
administratifs et opérationnels difficiles à automatiser, notamment la recherche d’informations.
Nous travaillons sur une technologie qui peut être utilisée sur un large spectre d’applications: la recherche de brevets (exemple de notre partenaire Symbio – spécialiste des piles à combustible), ou la recherche par chatbot dans les documents historiques des Annales de l’École des Mines de Paris.
Nous utilisons les LLM (Grands Modèles de Langage) qui permettent d’opérationnaliser et d’exploiter le contenu sémantiquement riche de larges bases de documents. Notre solution se compose d’un système d’indexation des documents et d’un système de recherche par vecteurs dont le résultat est fourni à un modèle génératif de langage.
Contact : Akin Kazakci (IHEIE)
Centre : Institut des Hautes Études pour l’Innovation et l’Entrepreneuriat (IHEIE)
Partenaires envisagés :
– Symbio
– Bibliothèque des Mines
– Foncia