Projets
-
Quæro : programme franco-allemand de projets de recherche et d'innovation industrielle (2008-2013) : gestion de campagnes d'annotation (relations de renommage de gènes, avec l'INRA MIG et entités nommées, actions et relations dans le domaine du football avec INRIA TexMex), participation aux campagnes d'annotation sur les entités nommées étendues dans des transcriptions de parole et en presse ancienne (avec le LIMSI), participation à la campagne d'annotation en entités nommées, termes et relations en pharmacologie (avec Jouve), mise en place d'un atelier interne sur l'annotation manuelle de corpus dans tous les médias (texte, parole, musique, vidéo), mise en place d'un groupe de travail sur les accords inter-annotateurs en TAL.
-
Participation au projet LexSynt (Lexiques Syntaxiques et interface lexique-grammaire : 2006-2007), soutenu par l'ILF (Institut de la Langue Française) : participation aux réunions, à la rédaction d'un projet ANR Corpus en 2007 (non retenu), création d'un lexique des prépositions du français (PrepLex).
-
Participation au projet BDSyn (Base de données pour la maintenance et la validation de lexiques syntaxiques : 2007-2009) du CPER TALC, LORIA, Nancy : participation aux réunion, spécification et réalisation d'un outil de validation collaborative de lexiques syntaxiques, Sylva.
-
Responsable Temis du projet Technolangue EVALDA CESART (Campagne d'Evaluation de Systèmes d'Acquisition de Ressources Terminologiques : 2003-2005) : participation aux réunions, participation à la campagne d'évaluation avec les outils Temis.
-
Responsable Temis du projet Technolangue EVALDA CESTA (Campagne d'Evaluation de Systèmes de Traduction Automatique) : participation aux premières réunions (2003).
-
CLIPS (aujourd'hui LIG), équipe GETA (aujourd'hui GETALP) : participation au projet UNL (Universal Networking Language, langage pivot construit à partir de l'anglais) pour l'Université des Nations Unies : amélioration du dictionnaire UNL-français et des grammaires de la génération du français (1998/99).
-
CLIPS, équipe GETA : participation au projet européen CORDIS NESPOLE! (Negociating through Spoken Language in E-commerce). Développements linguistiques et informatiques (Lex & Yacc, C, PERL), sous Unix, pour la génération du français.
Campagnes d'annotation
- Annotation en morpho-syntaxe d'un corpus de français parlé, TCOF-POS, en collaboration avec C. Benzitoun de l'ATILF
- Annotation d'entités nommées structurées (presse ancienne et transcription de nouvelles radiodiffusées) en collaboration avec le LIMSI (guide d'annotation)
- Annotation d'entités nommées, d'actions et de relations dans le domaine du football, en collaboration avec V. Claveau de l'équipe TexMex de l'IRISA
- Annotation d'entités nommées, de termes et de relations en pharmacologie (brevets), en collaboration avec Jouve
- Annotation de renommage de gènes (notices PubMed), en collaboration avec l'équipe MIG de l'INRA Jouy en Josas (corpus, utilisé pour la "shared task" BioNLP)
- Annotation de noms d'espèces, de gènes et de protéines (notices PubMed), en collaboration avec l'équipe MIG de l'INRA Jouy en Josas