Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
equipes:rcln:ancien_wiki:projets:semeval:2015 [2019/04/08 14:31] rosse |
equipes:rcln:ancien_wiki:projets:semeval:2015 [2020/11/23 18:42] (Version actuelle) garciaflores ↷ Liens modifiés en raison d'un déplacement. |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
====== SemEval 2015 ====== | ====== SemEval 2015 ====== | ||
- | * Lien à SemEval-2012 task 6: [[http:// | + | ===== La tarea: STS |
- | * Lien à SemEval-2013 | + | |
- | * Lien à SemEval-2014: | + | |
- | Données 2012: | + | Similaridad Semántica Textual (Semantic Textual Similarity, STS) |
- | * [[https://git.lipn.univ-paris13.fr/semeval/master/tree/SemEval2012/taskData|Train + Test]] | + | |
- | Données 2013: | + | ===== Miembros |
- | * [[https://git.lipn.univ-paris13.fr/semeval/master/tree/SemEval2013/test-core.tgz|Test]] | + | ==== LIPN ==== |
- | * [[https://git.lipn.univ-paris13.fr/semeval/master/tree/SemEval2013/gs-core.tgz|Gold Standard]] | + | * Davide Buscaldi |
+ | * Jorge GarcIa Flores | ||
+ | * Nadi Tomeh | ||
+ | * Joseph Le Roux | ||
+ | |||
+ | ==== IIMAS ==== | ||
+ | * Iván Vladimir Meza | ||
+ | * José Manuel Snyder | ||
+ | * Ismael Atzallaca Servin | ||
+ | * Isaac Rodríguez | ||
+ | |||
+ | ==== LDI ==== | ||
+ | * Belem Priego | ||
+ | |||
+ | ===== Definición de la tarea ===== | ||
+ | |||
+ | Dadas dos oraciones, s1 y s2, los sistemas participantes en la tarea deben calcular qué tan similares son s1 y s2 regresando un ‘score’(puntuación) de similaridad y opcionalmente un ‘score’ de confianza. | ||
+ | |||
+ | ==== Ejemplos español | ||
+ | |||
+ | Para español la escala va de 0 a 4. | ||
+ | |||
+ | * Significan lo mismo **(4)** | ||
+ | < | ||
+ | //El pájaro se esta bañando en el lavabo.//\\ | ||
+ | //El pájaro se está lavando en el aguamanil.// | ||
+ | </ | ||
+ | * Casi significan lo mismo, pero detalles sin importancia difieren **(3)** | ||
+ | < | ||
+ | //John dijo que él es considerado como testigo, y no como sospechoso.// | ||
+ | //"Él ya no es un sospechoso," | ||
+ | </ | ||
+ | * Casi significan lo mismo, pero detalles importantes tema **(2)** | ||
+ | < | ||
+ | //Ellos volaron del nido en grupos.//\\ | ||
+ | //Volaron hacia el nido juntos.// | ||
+ | </ | ||
+ | * No son equivalentes pero son en el mismo tópico **(1)** | ||
+ | < | ||
+ | //La mujer está tocando el violín.// | ||
+ | //La joven disfruta escuchar la guitarra.// | ||
+ | </ | ||
+ | * Las dos oraciones son de temas diferentes **(0)** | ||
+ | < | ||
+ | //Al amanecer, Juan se fue a montar a caballo con un grupo de amigos.//\\ | ||
+ | //La salida del sol al amanecer es una magnífica vista que puede presenciar si usted se despierta lo suficientemente temprano para verla.// | ||
+ | </ | ||
+ | |||
+ | ==== Ejemplos inglés | ||
+ | |||
+ | La escala para el score en inglés es la siguiente de 0 a 5: | ||
+ | |||
+ | * Significan lo mismo **(5)** | ||
+ | < | ||
+ | //The bird is bathing in the sink.//\\ | ||
+ | //Birdie is washing itself in the water basin.// | ||
+ | </ | ||
+ | * Casi significan lo mismo, pero detalles sin importancia difieren **(4)** | ||
+ | < | ||
+ | //In May 2010, the troops attempted to invade Kabul.//\\ | ||
+ | //The US army invaded Kabul on May 7th last year, 2010.// | ||
+ | </ | ||
+ | * Casi significan lo mismo, pero detalles importantes difieren **(3)** | ||
+ | < | ||
+ | //John said he is considered a witness but not a suspect.// | ||
+ | //"He is not a suspect anymore." | ||
+ | </ | ||
+ | * No son equivalente pero comparten informaciòn **(2)** | ||
+ | < | ||
+ | //They flew out of the nest in groups.//\\ | ||
+ | //They flew into the nest together.// | ||
+ | </ | ||
+ | * No son equivalentes pero son en el mismo tema **(1)** | ||
+ | < | ||
+ | //The woman is playing the violin.//\\ | ||
+ | //The young lady enjoys listening to the guitar.// | ||
+ | </ | ||
+ | * Las dos oraciones son en temas diferentes **(0)** | ||
+ | < | ||
+ | //John went horse back riding at dawn with a whole group of friends.// | ||
+ | //Sunrise at dawn is a magnificent view to take in if you wake up early enough for it.// | ||
+ | </ | ||
+ | Para determinar el desempeño del sistema se usa la correlación media de Pearson (existe un código que hace la evaluación) | ||
+ | |||
+ | ==== Restricciones | ||
+ | |||
+ | * Para inglés no se puede usar Ontonotes y datos del artículo escrito por Guo et al., 2013 | ||
+ | * Para español no se puede usar información de la wikipedia | ||
+ | Formato de los archivos | ||
+ | |||
+ | ===== Fechas importantes | ||
+ | |||
+ | * 5 de diciembre 2014, comienza la evaluación | ||
+ | * 20 de diciembre 2014, termina la evaluación | ||
+ | * 30 de enero 2015, artículo | ||
+ | * 28 de febrero 2015, revisiones | ||
+ | * 30 de marzo 2015, versiòn final de artículo | ||
+ | * Verano 2015, taller | ||
+ | |||
+ | ===== Links importantes | ||
+ | |||
+ | * [[http://alt.qcri.org/ | ||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | |||
+ | ==== Referencias sobre NLP ==== | ||
+ | |||
+ | * [[http:// | ||
+ | * [[http://www.nltk.org/]] La documentación de librería | ||
+ | * [[http:// | ||
+ | |||
+ | ===== Formato de archivos | ||
+ | |||
+ | ==== Archivos con ejemplos/ | ||
+ | |||
+ | Por línea, hay dos oraciones separadas por un tabulador | ||
+ | < | ||
+ | A man with a bottle is petting a brown horse. | ||
+ | A white cat rests it head on a stone. | ||
+ | An English-themed furniture set. A large steam locomotive pulling a passenger train through the countryside. | ||
+ | An airplane sitting on the tarmac at an airport with another plane in the background. | ||
+ | The udders of a dairy cow that is standing in a pasture near a large building. | ||
+ | </ | ||
+ | |||
+ | ==== Archivo de referencia | ||
+ | |||
+ | En este archivo cada línea corresponde a un score por cada par de oraciones del archivo de ejemplos. Este score representa el promedio del valor asignado por humanos. Calcular este score es que buscamos capturar. | ||
+ | |||
+ | < | ||
+ | 3.6924 | ||
+ | 0.5730 | ||
+ | 3.2319 | ||
+ | 1.2929 | ||
+ | </ | ||
+ | |||
+ | ==== Archivo de resultados | ||
+ | |||
+ | Por línea de ejemplo un nùmero real entre 0 y 4 (0 a 5 para inglés), seguido de un nivel de confianza entre 0 y 100. Este archivo es el que generamos y enviamos a la organización. | ||
+ | |||
+ | < | ||
+ | 3.7368 | ||
+ | 0.5002 | ||
+ | 3.0136 | ||
+ | 4.1593 | ||
+ | </ | ||
+ | |||
+ | |||
+ | ==== Datos de la competencia | ||
+ | |||
+ | |||
+ | === Inglés 2014 === | ||
+ | |||
+ | * [[http:// | ||
+ | | ||
+ | |||
+ | === Español 2014 === | ||
+ | |||
+ | * [[http://alt.qcri.org/ | ||
+ | * [[http://alt.qcri.org/ | ||
+ | * Archivos de resultados (No resultados) | ||
+ | |||
+ | ===== Metodologías propuestas | ||
+ | |||
+ | - Spectral similarity - LIPN | ||
+ | * [[http:// | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | | ||
+ | * [[http:// | ||
+ | | ||
+ | | ||
+ | - Sparse decoding - IIMAS | ||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | * [[https:// | ||
+ | |||
+ | ===== Instalar y correr SOPA ===== | ||
+ | * [[equipes: | ||
+ | |||
+ | ===== Reuniones | ||
+ | |||
+ | - [[equipes: | ||
+ | |||
+ | ===== Videos | ||
+ | |||
+ | ===== Sección en inglés | ||
+ | ==== Task preparation (TODO) | ||
+ | === Scientific === | ||
+ | - Adapt the [[http:// | ||
+ | - Study the results in 2015: check correlation between (global and feature) scores and the gold standard score, find sentences that have low correlation and understand why | ||
+ | - Perform error analysis of 2014 data (Davide) | ||
+ | |||
+ | === Technical === | ||
+ | - Finish the Semeval testing platform where you can run test on any of the STS Semeval historical datasets and where you can train on past Semeval data and test on current data (Jorge). Actually, Iván proposes that we take Semeval 2014 as our only training corpus and every other Semeval as a testbed. | ||
+ | - Install, configure and run Davide' | ||
+ | - Implement [[http:// | ||
+ | |||
+ | |||
+ | ==== Tarea alternativa ¿? | ||
+ | * [[http:// | ||
+ | |||
+ | ==== Meetings | ||
+ | * [[equipes: | ||
+ | * [[October|2, | ||
+ | ===== Semeval 2015 conference ===== | ||
+ | * [[equipes: | ||