Warning This site is not recommended for Internet Explorer browsers. Please use another web browser to get a better experience.

Stage : Évaluation de la performance de grands modèles de langage en science des matériaux F/H

Published
Company : Safran Job field : Mathematics and algorithms Location : Magny-les-hameaux France , Ile de France , France Contract type : Internship / Student Contract duration : Full-time Required degree : Master Degree Required experience : More than 3 years Professional status : Student Spoken language(s) : English Fluent
Published

Job Description

Les méthodes d'apprentissage automatique voient leur usage se populariser progressivement dans le domaine de la science des matériaux au gré des évolutions des moyens informatiques les supportant, et des impératifs de développement de nouveaux matériaux toujours plus performants. Dans le domaine aéronautique, ces impératifs sont tant environnementaux que socio-économiques : diminution des émissions de gaz à effet de serre, réduction des émissions sonores et de la consommation de carburant, différentiation des produits…
De manière générale, la recherche de nouveaux matériaux performants est compliquée par leur grande complexité : grand nombre d'éléments chimiques, procédés et paramètres de mise en œuvre divers... Cette complexité résulte, par explosion combinatoire, en un immense espace des possibles dont de nombreuses zones demeurent aujourd'hui inconnues mais qui renferment les matériaux de demain.
Les méthodes d'apprentissage automatique sont exploitées pour leur capacité à guider dans cet espace titanesque la conception de nouveaux matériaux, en simplifiant la modélisation du lien entre leur composition, leur structure et leurs propriétés. Cependant, la viabilité de ces méthodes repose de fait sur l'existence de données qu'il convient de générer par la réalisation de plans d'expériences, ou de collecter si elles ont déjà été générées.

Complementary Description

Ce projet s'inscrit dans le cadre de travaux ayant pour but l'évaluation de la pertinence de grands modèles de langage (Large Language Models, LLM) ou modèles de fondation, tel OpenAI GPT, selon deux axes.
Le premier axe concerne la collection de données automatisée pour l'analyse accélérée de corpus bibliographiques. La pertinence des LLM sera jugée sur la qualité de l'extraction de connaissances précises dans des publications scientifiques et techniques, en vue de la constitution de bases de données composition-propriétés alimentant des modèles d'apprentissage supervisé.
Le second axe concerne la spécialisation de LLM aux problèmes propres à la science des matériaux, exploitant des bases de données existantes ou celles constituées dans le cadre des travaux suivant l'axe précédent. L'objectif est ici d'évaluer le potentiel des modèles de fondation pour remplacer ou compléter les modèles de classification ou de régression classiques (réseaux de neurones peu profonds, processus gaussiens, méthodes ensemblistes…).
Le projet a pour principale application le développement de nouveaux revêtements mis en œuvre par PVD (Physical Vapor Deposition) pour la fonctionnalisation de surfaces. L'étude se focalisera sur l'analyse d'une bibliographie restreinte autour du domaine des revêtements céramiques binaires, relativement bien connu, et confirmera (ou infirmera) la pertinence des connaissances extraites automatiquement vis-à-vis des connaissances des experts du domaine.

Job Requirements

Étudiant.e en première ou deuxième année de master en mathématiques appliquées, statistiques ou sciences informatiques ayant de solides connaissances en apprentissage automatique/machine learning. Une appétence pour les matériaux est accessoire mais bienvenue.

Locate your future workplace

Rue des jeunes bois 78114

Magny-les-hameaux France

Ile de France France

Copy Address
83,000
employees worldwide
27
Number of countries where Safran is located
35
business area families