RCLN : Représentation des Connaissances et Langage Naturel
Responsable: Nathalie Pernelle
L’équipe rassemble des compétences en Traitement Automatique des Langues (TAL), en linguistique de corpus, en web sémantique, ainsi qu’en fouille de données et en apprentissage automatique. Ces compétences complémentaires lui confèrent un positionnement original et lui permettent de mener des travaux innovants pour l’analyse et l’exploration de corpus de textes, ainsi que pour l’acquisition de connaissances à partir de textes ou de graphes de connaissances.
L’équipe travaille sur des approches permettant de traiter la complexité des problèmes dans les textes ou dans les graphes de connaissances, comme l’analyse syntaxique profonde, l’extraction simultanée de relations sémantiques et d’entités nommées, ou encore la complétion de graphes, à l’aide de méthodes issues de l’apprentissage profond, de l’optimisation combinatoire, de l’exploration de données ou de la programmation logique inductive. L’équipe est notamment active sur le traitement de langues sous-dotées ou spécialisées, la détection de néologismes et l’analyse des microblogs.
L’équipe RCLN prend une part active dans la direction et les travaux du Labex « Empirical Foundations of Linguistics » (EFL), dont elle coordonne l’axe Analyse sémantique computationnelle. Au niveau local elle est membre de la fédération MathSTIC dont elle co-anime l’axe Optimisation et apprentissage appliqués aux contenus numériques.
L’équipe est structurée autour de trois axes de recherche étroitement liés :
- Algorithmes pour l’analyse syntaxique et sémantique des textes
- Exploration et génération de textes
- Acquisition de connaissances.
Ces trois axes sont complémentaires : l’analyse syntactico-sémantique de corpus peut servir de base à l’exploration de textes et à l’acquisition de connaissances, et inversement les algorithmes d’analyse peuvent tirer profit des connaissances acquises.
La fouille de littérature scientifique est définie comme un axe transversal de l’équipe. En effet, les publications de recherche ou les jeux de données partagés pourraient être mieux exploités par des systèmes intelligents afin de soutenir et d’accélérer les efforts scientifiques, en facilitant l’extraction d’experts, la génération de textes à l’état de l’art, la génération d’hypothèses scientifiques, ou encore pour soutenir ou contredire certaines hypothèses.
Liens vers le rapport d’activité 2017 – 2022 et projet 2023-2028 de l´équipe RCLN