Neoveille

Ce projet de recherche est financé par la COMUE Sorbonne Paris Cité sur la période juin 2015 - juin 2018. 

Résumé du projet : Les dictionnaires de langue décrivent les lexies et leurs sens. Mais ce vocabulaire et leur usage évoluent avec le temps. Cela est évident à l'échelle historique, mais également en diachronie « courte » : on estime à environ 10% le nombre moyen de mots inconnus dans les textes de langue générale. Une grande partie de ces mots sont des noms propres et des erreurs typographiques, mais également des néologismes proprement dits. Le taux de néologismes sémantiques est quant à lui aujourd'hui plus difficilement quantifiable. La néologie, l'étude de ces évolutions, doit nous éclairer sur la vie des formes linguistiques et des sens. Comprendre le processus néologique est donc indispensable à la linguistique générale, mais aussi à la linguistique appliquée (mise à jour de dictionnaires de langue et de ressources lexicales pour les applications TAL). Pluridisciplinaire, le projet associe des compétences en informatique (TAL) en linguistique (lexicologie, terminologie, sémantique) et en sociolinguistique. Il est l’occasion de formaliser des collaborations entre 4 laboratoires USPC : LIPN, LDI (UP13), CLILLAC-ARP (UP7) et ERTIM (INALCO) et un partenaire international (univ. de Sao Paulo). Ce projet a pour objectif d'étudier deux types spécifiques de néologismes : les emprunts et les néologismes sémantiques. Il développera une plateforme de veille multilingue destinée au repérage et au suivi des néologismes à partir de flux de documents en provenance du web et de corpus diachroniques préexistants. Ce projet est innovant sur plusieurs points : (i) aucune plateforme de repérage ni de suivi des néologismes à partir de flux de corpus n’existe actuellement, sauf pour l'anglais ; elle combinera deux approches complémentaires (ii) un programme inédit de suivi des profils combinatoires des néologismes sera réalisé. (iii) une étude à grande échelle des emprunts sera conduite impliquant sept langues.

Objectifs du projet :

  • mettre en place une plateforme multilingue de veille et de suivi des néologismes à partir de corpus diachroniques de très grande taille ;
  • utiliser cette plateforme pour mener une étude des emprunts (notamment anglicismes) dans différentes langues (français, portugais du Brésil, chinois, russe, tchèque, polonais et grec) ;
  • utiliser cette plateforme pour étudier la notion d'innovation sémantique et pour proposer de nouvelles mesures pour identifier les nouveaux emplois.

Site web du projet (merci de m'adresser un email pour obtenir un identifiant) : plateforme