|
|
Lundi 29 Janvier
Heure: |
14:00 - 15:00 |
Lieu: |
Salle B107, bâtiment B, Université de Villetaneuse |
Résumé: |
Approches non supervisées pour l'extraction de relations sémantiques |
Description: |
Kata Gabor Les approches actuellement utilisées pour lextraction dinformations et de connaissances s'appuient majoritairement à la classification supervisée ou semi-supervisée. Elles exploitent des bases de connaissances structurées qui fournissent un modèle des connaissances, et le plus souvent également des données annotées par des humains. Or, de telles ressources sont couteuses à produire en matière de temps et dexpertise, et l'adaptation de domaine pose des difficultés.
Nous cherchons à mettre en oeuvre des méthodes d'extraction d'informations qui minimisent les besoins en intervention humaine. Nous proposons et comparons plusieurs approches à la tâche d'extraction non supervisée de relations sémantiques à partir de corpus. Les approches ont été évaluées sur un corpus de domaine de taille limité, ainsi que sur un corpus et un jeu d'évaluation de vocabulaire générique. La première approche utilise des word embeddings pour caractériser le sens des concepts et pour calculer la similarité relationnelle entre plusieurs paires de concepts. La deuxième approche utilise la fouille de motifs séquentiels, combiné avec l'analyse sémantique, pour identifier les contextes qui permettent de détecter les relations. Finalement, nous proposons des pistes d'amélioration, en particulier en ce qui concerne l'hybridisation des deux approches. |
|
|