Advertencia No se recomienda usar Internet Explorer para navegar por este sitio. Utilice otro navegador para una mejor experiencia.

Apprenti-e : Application RAG/LLM avec des données spécifiques F/H

Publicado
Empresa : Safran Campo de actividad : Matemáticas y Algoritmos Ubicación : Magny-les-hameaux France , Ile de France , Francia Tipo de contrato : Becario Duración del contrato : Tiempo parcial Titulación requerida : Profesional / Licenciatura / Grado / Diplomatura Experiencia requerida : Primera experiencia Categoría profesional : Estudiante
Publicado

Descripción del puesto de trabajo

Safran est un groupe international de haute technologie, équipementier de premier rang dans les domaines de l'Aéronautique, de l'Espace, de la Défense et de la Sécurité. Au sein de Safran Tech (le centre de R&T du groupe), l'Unité de Recherche Maths & Algorithms for Temporal Data (MATD) développe de nouveaux outils pour répondre aux grands enjeux en aéronautique ; en particulier, des méthodes de suivi efficaces de la santé des équipements, afin d'optimiser la maintenance et garantir la sécurité.
Des avancées récentes des grands modèles de langage génératif (en anglais, Large Language Model (LLM)) rencontrent un succès dans de nombreux domaines et applications. En particulier, au sein de l'écosystème de travail de Safran, il existe un besoin d'utilisation des modèles de LLM pour faciliter l'extraction d'informations à partir d'un ensemble de données de documentation métier. L'un des défis de l'utilisation de ces modèles dans cette tâche est de savoir comment ré-entraîner les modèles LLM avec des connaissances spécifiques au domaine ou des données supplémentaires, ce qui nécessite souvent des pipelines complexes et des ressources informatiques coûteuses.
Récemment, la Génération Augmentée par Récupération (en anglais, Retrieval Augmented Generation (RAG)) a été introduite comme une technique prometteuse pour faciliter l'incorporation de données supplémentaires aux LLM. Comparé aux modèles de génération conventionnels, RAG présente des avantages remarquables et a notamment atteint des performances de pointe dans de nombreuses tâches de traitement du langage naturel, telles que la génération de réponses de dialogue, la traduction automatique et le résumé [1]. En général, en appliquant la technique RAG, nous n'avons pas besoin de nous plonger profondément dans l'architecture (souvent complexe) du LLM ni dans la procédure d'entraînement complète de bout en bout. Au lieu de cela, le pipeline RAG ne nécessite que quelques étapes de code (voire aucune) pour permettre au modèle d'accéder et de s'améliorer à partir de données supplémentaires, grâce à des packages Python tels que Langchain [2].

Descripción complementaria

Dans ce sujet, nous explorons l'application de la technique RAG aux modèles LLM (par exemple, Mistral et LLAMA 2) dans la génération de réponses de dialogue impliquant la récupération d'informations à partir d'un ensemble de données de documentation techniques de Safran Tech (contenant des données textuelles sous forme de fichiers .pdf).
La mission en tant qu'apprenti-e consiste à :
• Comprendre et maîtriser les pratiques avec la bibliothèque Langchain (en Python) pour intégrer la technique RAG avec les modèles Mistral et LLAMA 2.
• Construire une plateforme/un logiciel (Python) pour relier le pipeline de Langchain à l'ensemble de données de documents de Safran.
• Proposer et réaliser amélioration pour les techniques RAG ainsi que d'autres méthodes de traitement du langage naturel.
• Participer à des travaux de l'équipe comme la mise en place et l'exécution d'expériences pour réaliser des articles scientifiques.
Bibliographie :
[1] Li, H., Su, Y., Cai, D., Wang, Y., & Liu, L. (2022). A survey on retrieval-augmented text generation. arXiv preprint arXiv:2202.01110.
[2] https://python.langchain.com/docs/expression_language/cookbook/retrieval

Requisitos del puesto de trabajo

Alternance en informatique/programmation pour machine learning en langage

Ubica tu futuro lugar de trabajo

Rue des jeunes bois 78114

Magny-les-hameaux France

Ile de France Francia

Copiar la dirección
83 000
empleados en todo el mundo
27
Número de países en los que está presente Safran
35
familias de especialidades