Réunion CONLL 2016 shared Task 25/01/2016

Joseph expose la tâche: analyse du discours superficielle à partir du papier qui la présente
- La tâche part des connecteurs explicites (before, so) pour reconnaitre les arguments, l'extension de l'influence du connecteur et attribuer une étiquette (Temporal.Asynchronous.Precedence).
On discute sur les exemples de la section 3.1 de l'article.
La tâche implique aussi le repérage de connecteurs implicites (section 3.1, exemple 4,5,6)
On révise les données d'évaluation (section 3.2 de l'article), extraites du Penn Tree Bank.
Les scores ne sont pas très bons pour les meilleurs systèmes (autour de 25%)… “On peut faire mieux”, dit Joseph.
On discute sur le niveau d'accord des annotateurs (autour de 75-85%)
On parle de la distribution des relations discursives (Table 3 de l'article). Il y a autant des relations explicites qu'implicites (plus difficiles à repérer, on suppose).
Deux modalités de participation: fermé (à entraîner qu'avec les données de la campagne et des outils non propriétaires) et ouvertes (à entraîner avec n'importe quel jeu des données et des outils non propriétaires), section Evaluation.
L'année dernière tout le monde à participer en modalité fermé
On télécharge le système sur une machine virtuelle et ce sont eux qui effectuent le blind test sur lequel est basé l'évaluation
Ce n'est pas nécessaire de reconnaître les connecteurs implicites.
Les argument doivent nécessairement coïncider avec l'extension du gold standard.

On calcule F pour:

Tous les participants ont adopté l'architecture de Lin et al (2014)
La majorité de participants en 2015 ont utilisé de l'apprentissage automatique. Très peu des approches font appel aux réseaux de neurones.
Les résultats en 2015 sont très bas (F~20-30%)
La détection de connecteurs n'est pas mauvaise: ~90% sur les explicites
On analyse le meilleur système de 2015
L'approche gagnant en 2015 ont fait une cascade de classificateurs
Joseph a deux idées:
Reprendre le système gagnant de l'année dernière en évitant la cascade de classificateurs et la cascade d'erreur
- Problème: on ne peut pas facilement réutiliser le système gagnant de 2015
- Quels sont les systèmes qu'on pourrait joindre?
Faire du deep learning
Nadi propose de faire une table de segmentation
Antoine propose de faire deux apprentissage séparés

Task definition