Ingénieur de recherche en traitement automatique des langues et extraction d'information (f/h)

Date limite de réponse :  4 mai 2026
Type de recrutement : 
Poste ouvert en CDD
Quotité de travail : 
100%
Niveau d'emploi : 
A - IGR - Ingénieur de Recherche
Durée du contrat : 
Du 01 juin 2026 au 30 novembre 2027
Localisation : 
LIG - Bâtiment IMAG
150, place du Torrent
38400 Saint-Martin-d'Hères

Présentation de la structure

Le Laboratoire d'Informatique de Grenoble (LIG, UMR 5217) est l'un des plus grands laboratoires français en informatique, regroupant environ 500 personnes (chercheurs, enseignants-chercheurs, doctorants, ingénieurs et personnels supports) sur le campus de Saint-Martin-d'Hères, Minatec et Montbonnot.
Tutelle conjointe de l'Université Grenoble Alpes, CNRS (INS2I), Grenoble INP et Inria, le LIG structure ses 24 équipes autour de 5 axes dont le traitement des données et connaissances à grande échelle.

Le poste à pourvoir se situe au sein de l'équipe pluridisciplinaire GETALP dont l’objectif est d’aborder tous les aspects théoriques, méthodologiques et pratiques de la communication et du traitement de l’information multilingue (écrite ou orale). Elle est reconnue internationalement depuis plus de 50 ans pour ses travaux de recherche en Traduction Automatique et Traitement des Langues (oral comme écrit). Elle contribue au domaine par de nombreuses publications, des grands modèles de langages généralistes ou spécialisés en oral et écrit et des jeux de données lexicales et linguistiques multilingues.

Missions principales

Sous la responsabilité de Gilles Sérasset et Didier Schwab, vous travaillerez en étroite collaboration avec des étudiants en thèse, post-doctorants et ingénieurs de recherches.
Votre mission consistera à définir et implémenter des méthodes avancées d’extraction et de réconciliation d’événements à partir de textes en français, dans divers domaines applicatifs (santé, industrie, relation clients, sécurité, …).
Vos travaux viseront à développer des solutions innovantes combinant syntaxe, sémantique, et modèles de langage (LLMs) pour structurer et aligner des informations événementielles complexes.

Activités principales

  • Concevoir et implémenter des algorithmes pour l’extraction d’événements (détection, classification, attribution de rôles sémantiques) à partir de textes en français
  • Développer des méthodes de réconciliation d’événements (alignement, fusion, résolution de conflits) entre sources multiples et bases de connaissances prélables
  • Explorer l’utilisation de graphes sémantiques et syntaxico-sémantiques (Ontologies, Knowledge Graphs, AMR, UMR, MR4AP, etc.) et de modèles de langage (LLMs génératifs ou non) pour l’extraction d'événements
  • Contribuer à la création de corpus annotés et de benchmarks pour l’évaluation des méthodes proposées
  • Proposer des métriques d’évaluation adaptées aux défis spécifiques des tâches (ex. gestion des événements partiels, conflits d’information)
  • Contribuer à la publication des résultats dans des conférences internationales (ex. ACL, EMNLP, TALN) et des revues scientifiques

Compétences attendues

  • Maitrise des langages de programmation : Python (PyTorch, TensorFlow, HuggingFace), bibliothèques NLP (spaCy, Stanza, etc.), langages de plus bas niveau (Rust/C)
  • Connaitre les techniques et savoir mettre en oeuvre des modèles de langage (LLMs): pretraining ou finetuning, embeddings, transformers (BERT, RoBERTa, etc.)
  • Apprentissage automatique : méthodes supervisées, graph neural networks, augmentation de données
  • Linguistique computationnelle : parsing syntaxique/sémantique (UD, AMR), résolution de coréférences
  • Expérience avec les graphes de connaissances ou les systèmes symboliques
  • Maîtrise des outils d’annotation collaborative (ex. INCEpTION, Prodigy)
  • Intérêt pour les enjeux éthiques liés à la désinformation ou à l’analyse de données sensibles
  • Autonomie et rigueur scientifique : capacité à proposer des solutions innovantes et à les valider expérimentalement
  • Esprit collaboratif : aisance pour travailler en équipe pluridisciplinaire (linguistes, ingénieurs, chercheurs).
  • Curiosité intellectuelle : intérêt pour les défis scientifiques ouverts (ex. alignement sémantique, évaluation des LLMs)
  • Capacité de rédaction : savoir rédiger des rapports techniques et contribuer à des articles de recherche
  • Niveau BAC +5 minimum requis avec une expérience en IA/TAL
  • Un diplôme de niveau doctorat serait apprécié en Traitement Automatique des Langues (TAL), Informatique, ou domaine connexe
  • Première expérience dans au moins l’un des aspects suivants : NLP moderne (modèles de langage LLMs, embeddings, transformers), apprentissage automatique (méthodes supervisées, graph neural networks, augmentation de données), linguistique computationnelle (parsing syntaxique/sémantique (UD, AMR), résolution de coréférences)

Conditions de diplômes

Bac + 5

Rémunération

A partir de 2289€ mensuel brut et en fonction de l’expérience.
Vous percevrez en plus de votre salaire un régime indemnitaire d'un montant mensuel brut de 716€, auquel s'ajoutera une prime informatique de 330 €.
Publié le  13 avril 2026
Mis à jour le  13 avril 2026