Réunion CONLL 2016 shared Task 25/01/2016
Task definition
- Joseph expose la tâche: analyse du discours superficielle à partir du papier qui la présente
- La tâche part des connecteurs explicites (before, so) pour reconnaitre les arguments, l'extension de l'influence du connecteur et attribuer une étiquette (Temporal.Asynchronous.Precedence).
- On discute sur les exemples de la section 3.1 de l'article.
- La tâche implique aussi le repérage de connecteurs implicites (section 3.1, exemple 4,5,6)
- On révise les données d'évaluation (section 3.2 de l'article), extraites du Penn Tree Bank.
- Les scores ne sont pas très bons pour les meilleurs systèmes (autour de 25%)… “On peut faire mieux”, dit Joseph.
- On discute sur le niveau d'accord des annotateurs (autour de 75-85%)
- On parle de la distribution des relations discursives (Table 3 de l'article). Il y a autant des relations explicites qu'implicites (plus difficiles à repérer, on suppose).
- Deux modalités de participation: fermé (à entraîner qu'avec les données de la campagne et des outils non propriétaires) et ouvertes (à entraîner avec n'importe quel jeu des données et des outils non propriétaires), section Evaluation.
- L'année dernière tout le monde à participer en modalité fermé
- On télécharge le système sur une machine virtuelle et ce sont eux qui effectuent le blind test sur lequel est basé l'évaluation
- Ce n'est pas nécessaire de reconnaître les connecteurs implicites.
- Les argument doivent nécessairement coïncider avec l'extension du gold standard.
Data
- On analyse le format des données d'entraînement (relation.json, parses.json)
- Le gold standard est le Penn Treebank modifié
Métriques
On calcule F pour:
- Reconnaissance des connecteurs explicites
- Identification de chacun des arguments
Méthodologie
- Tous les participants ont adopté l'architecture de Lin et al (2014)
- La majorité de participants en 2015 ont utilisé de l'apprentissage automatique. Très peu des approches font appel aux réseaux de neurones.
- Les résultats en 2015 sont très bas (F~20-30%)
- La détection de connecteurs n'est pas mauvaise: ~90% sur les explicites
- On analyse le meilleur système de 2015
- L'approche gagnant en 2015 ont fait une cascade de classificateurs
- Joseph a deux idées:
- Reprendre le système gagnant de l'année dernière en évitant la cascade de classificateurs et la cascade d'erreur
- Problème: on ne peut pas facilement réutiliser le système gagnant de 2015
- Quels sont les systèmes qu'on pourrait joindre?
- Faire du deep learning
- Nadi propose de faire une table de segmentation
- Antoine propose de faire deux apprentissage séparés
Deadline
- 24/04/16
ToDo
- Lire les autres approches (se partager les articles)
- Faire des statistiques sur les données
- Partager les données sur le serveur TAL
- Créer une chaîne slack et un Trello
- Créer un groupe de mél pour CONLL
- Créer un depôt gitlab pour le code source
Prochaine réunion
- Lundi 1/02/16 à 14h avec un ToDo de lecture:
- (Lin et al, 2014) Joseph
- Le papier gagnant (Wang & Lan 2015)
- Le papier de réseaux de neurones (Ji & Eisenstein): Antoine
- Dublin2 2015: Nadi
- Prasad et al 2008: François
- Trento 2015: Ivan