Stage de recherche Master 2 : Développement d’algorithmes d’IA
A propos de nous
L'Université Gustave Eiffel, modèle innovant d’université rassemblant le triptyque université, écoles et organisme de recherche, dispose de plusieurs campus de formation et de recherche implantés sur le territoire national.
L’établissement compte plus de 15000 étudiants et plus de 3000 personnels enseignant (e)s-chercheur(e)s, chercheur(e)s et personnels d’appui au sein de 33 laboratoires, 15 composantes de formation ainsi qu’au sein de services support et de soutien.
L’université œuvre dans de nombreux domaines de recherche et représente à elle seule un quart de la recherche française sur les villes de demain. Elle regroupe des compétences pluridisciplinaires pour conduire des recherches de qualité au service de la société, proposer des formations adaptées au monde socio-économique et accompagner les politiques publiques.
L’Université Gustave Eiffel est également la première université française en apprentissage et forme jeunes, salariés, ou citoyens à tous les niveaux ; apporte des éclairages scientifiques à l’ensemble de la société et vise à contribuer in fine à l’élévation du niveau de qualification de tous.
Visionner le film de présentation : https://www.youtube.com/watch?v=8uVHEAaj75A
Mission proposée
Sujet proposé :
Développement d’algorithmes d’IA (Transformers/IA générative) pour générer une codification automatique
de la nature et de la gravité des lésions consécutives à un accident de la route, à partir de données
des urgences.
Le stage se déroulera aux Hospices civils de Lyon, au sein du service d’urgences de l’Hôpital
Édouard-Herriot (HEH) et en étroite collaboration avec l’Umrestte (Unité Mixte de Recherche
Épidémiologique et de Surveillance Transport Travail Environnement) de l’Université Gustave Eiffel à
Bron.
Conditions du stage
Vous serez accompagné.e dans le déroulé de votre stage et l’acquisition de compétences professionnelles.
Encadrement : Florian Robinet, data scientist à l’Umrestte et Youri Yordanov, Professeur de médecine
d’urgence aux HCL
Gratification : selon réglementation publique : 27,30€ par jour / Durée horaire journalière de 7h / Congés
sans solde possibles.
Possibilité de poursuivre en thèse.
Contexte et problématique
Depuis 30 ans, l’Umrestte développe une base de données unique en Europe, qui recense toutes les
victimes d’accidents de la circulation sur le département du Rhône (Registre du Rhône). Chaque dossier
de victime est examiné par un médecin afin de déterminer la nature et la gravité des lésions selon la
classification AIS (Abbreviated Injury Scale). Ce processus exige une expertise clinique approfondie sur
laquelle il est aujourd’hui proposé de s’appuyer pour développer un codage automatisé des lésions
consécutives à un traumatisme routier. Pour cela, les méthodes d’apprentissage profond, en particulier
celles basées sur des architectures de type Transformer et d’IA générative, offrent de nouvelles
possibilités pour automatiser le processus de codification.
Ce codage automatisé sera utile à la mise en place future d’un e-Registre dans le département du Rhône,
et alimentera également un observatoire national des traumatismes.
Objectif du stage
Le stage proposé a pour objectif principal d’étudier, au sein d’un service d’urgences des Hospices Civils
de Lyon, la faisabilité d’un développement d’algorithmes d’intelligence artificielle (IA) basés sur des
modèles Transformers/IA générative pour automatiser la codification AIS des lésions consécutives à un
accident de la route, à partir de données textuelles issues de l’observation type du DMU des HCL.
Principales étapes :
Préparation des données : identification, structuration et anonymisation des textes, extraction des variables
pertinentes, constitution de jeux d’entraînement et de test validés manuellement.
Développement IA : implémentation et ajustement de modèles de type Transformers (BERT, GPT-like),
exploration de stratégies d’IA générative pour la classification et la prédiction des codes AIS, adaptation
du pipeline aux spécificités de la codification des traumatismes.
Validation et évaluation : définition de métriques de performance (exactitude, sensibilité, précision, F1-
score), comparaison avec le codage manuel expert.
Le profil idéal
Formation, compétences et profil requis
M2 Data science / Informatique / Mathématiques appliquées
Langages : Python (pandas, scikit-learn, PyTorch), Jupyter.
Librairies : Hugging Face Transformers / Datasets, tokenizers
Notions : NLP, fine-tuning de Transformers, évaluation classification, gestion de dataset, versioning
(Git).
Softskill: communication, rigueur documentaire, autonomie.
Optionnel (fortement apprécié) : expérience sur données médicales
Réel intérêt ou curiosité pour la thématique de recherche
Volontaire et désireu.x.se de se former
Apprécie le travail d’équipe
Rigueur et sens de l’organisation