Lundi 29 Janvier


Retour à la vue des calendrier
Lundi 29 Janvier
Heure: 14:00 - 15:00
Lieu: Salle B107, bâtiment B, Université de Villetaneuse
Résumé: Approches non supervisées pour l'extraction de relations sémantiques
Description: Kata Gabor Les approches actuellement utilisées pour l’extraction d’informations et
de connaissances s'appuient majoritairement à la classification
supervisée ou semi-supervisée. Elles exploitent des bases de
connaissances structurées qui fournissent un modèle des connaissances,
et le plus souvent également des données annotées par des humains. Or,
de telles ressources sont couteuses à produire en matière de temps et
d’expertise, et l'adaptation de domaine pose des difficultés.

Nous cherchons à mettre en oeuvre des méthodes d'extraction
d'informations qui minimisent les besoins en intervention humaine. Nous
proposons et comparons plusieurs approches à la tâche d'extraction non
supervisée de relations sémantiques à partir de corpus. Les approches
ont été évaluées sur un corpus de domaine de taille limité, ainsi que
sur un corpus et un jeu d'évaluation de vocabulaire générique. La
première approche utilise des word embeddings pour caractériser le sens
des concepts et pour calculer la similarité relationnelle entre
plusieurs paires de concepts. La deuxième approche utilise la fouille de
motifs séquentiels, combiné avec l'analyse sémantique, pour identifier
les contextes qui permettent de détecter les relations. Finalement, nous
proposons des pistes d'amélioration, en particulier en ce qui concerne
l'hybridisation des deux approches.