Niveau hiérarchique : Stagiaire

Secteur

  • Biotechnologie
  • Agro-alimentaire

Type d’emploi : Temps plein

Fonctions

  • Management de projet
  • Sciences
  • Études/recherche

Sujet proposé

La réalisation des bases de données de spectres dans le but de réaliser des modèles est une étape fondamentale et complexe. La connaissance de la technologie, des conditions de mesure et des échantillons analysés font partie de l’expertise requise. Un élément clé consiste à déterminer la technique optimale d’acquisition de la mesure. En effet, la mesure d’un échantillon consistant en une réalisation statistique, il convient d’en faire une bonne estimation en répétant l’expérience. La répétition des mesures est un élément déterminant puisqu’il dimensionne la base de données et le temps de mesure nécessaire pour réaliser les expériences dans leur globalité.

Le nombre de mesures à réaliser sur un échantillon homogène est aujourd’hui défini empiriquement à partir des années d’expériences acquis sur des spectromètres de laboratoire. Lorsque les échantillons deviennent plus complexes et que les capteurs spectrométriques sont réduits en taille et capacités, l’estimation empirique du nombre de mesures est à remettre en cause.

Ce premier paramètre clé de la réalisation de mesures constitue le sujet majeur du stage.Des sujets annexes seront traités dont la détection d’outlier de mesure. GreenTropism dispose de plusieurs technologies de capteurs permettant d’adapter et d’enrichir le stage sur ces problématiques.

Le stage proposé par GreenTropism consistera à analyser l’influence du nombre de réalisations de la mesure dans le but de mieux comprendre son influence sur les performances de modèles prédictifs. La problématique consiste à déterminer une méthodologie pour déterminer ce paramètre en optimisant le temps de mesure du laboratoire et les performances du modèle.

Ce stage sera composé d’une partie laboratoire consistant à réaliser des mesures spectroscopiques avec différents appareils sur des échantillons à déterminer en collaboration avec le futur stagiaire, et d’une partie analyse des données. Un co-encadrement Laboratoire / Data Sciences sera mis en place.

Les étapes du stage se dérouleront de la manière suivante :

  1. Prise en main de la chaîne analytique de la spectroscopie via un projet de modélisation
  2. Définition du plan d’expérience pour l’étude du sujet
  3. Réalisation des mesures du plan d’expérience
  4. Analyse des données permettant d’étudier le paramètre

Ce stage requiert une bonne compréhension des phénomènes physiques mis en jeu et des connaissances des principes de base du Machine Learning. Au niveau pratique, une capacité d’autonomie est requise ainsi que la capacité d’adaptation à des outils informatiques de traitement de données (Python).

Profil recherché

Formation requise : BAC+5, école d’ingénieur, parcours universitaire filière informatique, physique, mathématiques appliquées, chimie analytique

Prérequis :

  • Des connaissances et un intérêt pour le machine learning
  • Une initiation dans un langage de programmation tel que Python, Matlab ou équivalent.
  • Une appétence pour l’environnement Start-up

Durée du stage : 6 mois

Localisation : Arcueil (RER B Laplace)

Envoi des CV et lettre de motivation : anthony.boulanger@greentropism.com