-
On discute sur les exemples de la section 3.1 de l'article.
La tâche implique aussi le repérage de connecteurs implicites (section 3.1, exemple 4,5,6)
On révise les données d'évaluation (section 3.2 de l'article), extraites du Penn Tree Bank.
Les scores ne sont pas très bons pour les meilleurs systèmes (autour de 25%)… “On peut faire mieux”, dit Joseph.
On discute sur le niveau d'accord des annotateurs (autour de 75-85%)
On parle de la distribution des relations discursives (Table 3 de l'article). Il y a autant des relations explicites qu'implicites (plus difficiles à repérer, on suppose).
Deux modalités de participation: fermé (à entraîner qu'avec les données de la campagne et des outils non propriétaires) et ouvertes (à entraîner avec n'importe quel jeu des données et des outils non propriétaires), section Evaluation.
L'année dernière tout le monde à participer en modalité fermé
On télécharge le système sur une machine virtuelle et ce sont eux qui effectuent le blind test sur lequel est basé l'évaluation
Ce n'est pas nécessaire de reconnaître les connecteurs implicites.
Les argument doivent nécessairement coïncider avec l'extension du gold standard.