LIG - Bâtiment IMAG 150, place du Torrent 38400 Saint-Martin-d'Hères
Présentation de la structure
Le Laboratoire d'Informatique de Grenoble (LIG, UMR 5217) est l'un des plus grands laboratoires français en informatique, regroupant environ 500 personnes (chercheurs, enseignants-chercheurs, doctorants, ingénieurs et personnels supports) sur le campus de Saint-Martin-d'Hères, Minatec et Montbonnot. Tutelle conjointe de l'Université Grenoble Alpes, CNRS (INS2I), Grenoble INP et Inria, le LIG structure ses 24 équipes autour de 5 axes dont le traitement des données et connaissances à grande échelle.
Le poste à pourvoir se situe au sein de l'équipe pluridisciplinaire GETALP dont l’objectif est d’aborder tous les aspects théoriques, méthodologiques et pratiques de la communication et du traitement de l’information multilingue (écrite ou orale). Elle est reconnue internationalement depuis plus de 50 ans pour ses travaux de recherche en Traduction Automatique et Traitement des Langues (oral comme écrit). Elle contribue au domaine par de nombreuses publications, des grands modèles de langages généralistes ou spécialisés en oral et écrit et des jeux de données lexicales et linguistiques multilingues.
Missions principales
Sous la responsabilité de Gilles Sérasset et Didier Schwab, vous travaillerez en étroite collaboration avec des étudiants en thèse, post-doctorants et ingénieurs de recherches. Votre mission consistera à définir et implémenter des méthodes avancées d’extraction et de réconciliation d’événements à partir de textes en français, dans divers domaines applicatifs (santé, industrie, relation clients, sécurité, …). Vos travaux viseront à développer des solutions innovantes combinant syntaxe, sémantique, et modèles de langage (LLMs) pour structurer et aligner des informations événementielles complexes.
Activités principales
Concevoir et implémenter des algorithmes pour l’extraction d’événements (détection, classification, attribution de rôles sémantiques) à partir de textes en français
Développer des méthodes de réconciliation d’événements (alignement, fusion, résolution de conflits) entre sources multiples et bases de connaissances prélables
Explorer l’utilisation de graphes sémantiques et syntaxico-sémantiques (Ontologies, Knowledge Graphs, AMR, UMR, MR4AP, etc.) et de modèles de langage (LLMs génératifs ou non) pour l’extraction d'événements
Contribuer à la création de corpus annotés et de benchmarks pour l’évaluation des méthodes proposées
Proposer des métriques d’évaluation adaptées aux défis spécifiques des tâches (ex. gestion des événements partiels, conflits d’information)
Contribuer à la publication des résultats dans des conférences internationales (ex. ACL, EMNLP, TALN) et des revues scientifiques
Compétences attendues
Maitrise des langages de programmation : Python (PyTorch, TensorFlow, HuggingFace), bibliothèques NLP (spaCy, Stanza, etc.), langages de plus bas niveau (Rust/C)
Connaitre les techniques et savoir mettre en oeuvre des modèles de langage (LLMs): pretraining ou finetuning, embeddings, transformers (BERT, RoBERTa, etc.)
Linguistique computationnelle : parsing syntaxique/sémantique (UD, AMR), résolution de coréférences
Expérience avec les graphes de connaissances ou les systèmes symboliques
Maîtrise des outils d’annotation collaborative (ex. INCEpTION, Prodigy)
Intérêt pour les enjeux éthiques liés à la désinformation ou à l’analyse de données sensibles
Autonomie et rigueur scientifique : capacité à proposer des solutions innovantes et à les valider expérimentalement
Esprit collaboratif : aisance pour travailler en équipe pluridisciplinaire (linguistes, ingénieurs, chercheurs).
Curiosité intellectuelle : intérêt pour les défis scientifiques ouverts (ex. alignement sémantique, évaluation des LLMs)
Capacité de rédaction : savoir rédiger des rapports techniques et contribuer à des articles de recherche
Niveau BAC +5 minimum requis avec une expérience en IA/TAL
Un diplôme de niveau doctorat serait apprécié en Traitement Automatique des Langues (TAL), Informatique, ou domaine connexe
Première expérience dans au moins l’un des aspects suivants : NLP moderne (modèles de langage LLMs, embeddings, transformers), apprentissage automatique (méthodes supervisées, graph neural networks, augmentation de données), linguistique computationnelle (parsing syntaxique/sémantique (UD, AMR), résolution de coréférences)
Conditions de diplômes
Bac + 5
Rémunération
A partir de 2289€ mensuel brut et en fonction de l’expérience. Vous percevrez en plus de votre salaire un régime indemnitaire d'un montant mensuel brut de 716€, auquel s'ajoutera une prime informatique de 330 €.
Partager le lienCopierCopiéFermer la fenêtre modalePartager l'URL de cette pageJe recommande cette page :Consultable à cette adresse :La page sera alors accessible depuis votre menu "Mes favoris".Arrêter la vidéoJouer la vidéoCouper le sonJouer le sonChat : Une question ?Chatbot Robo FabricaStatistiques de fréquentation MatomoX (anciennement Twitter)