Table des matières

SemEval 2015

La tarea: STS

Similaridad Semántica Textual (Semantic Textual Similarity, STS)

Miembros

LIPN

IIMAS

LDI

Definición de la tarea

Dadas dos oraciones, s1 y s2, los sistemas participantes en la tarea deben calcular qué tan similares son s1 y s2 regresando un ‘score’(puntuación) de similaridad y opcionalmente un ‘score’ de confianza.

Ejemplos español

Para español la escala va de 0 a 4.

Ejemplos inglés

La escala para el score en inglés es la siguiente de 0 a 5:

Restricciones

Fechas importantes

Referencias sobre NLP

Formato de archivos

Archivos con ejemplos/problemas

Por línea, hay dos oraciones separadas por un tabulador

A man with a bottle is petting a brown horse.        Man petting horse over fence.
A white cat rests it head on a stone.        A striped cat looking lazily through vertical blinds.
An English-themed furniture set.        A large steam locomotive pulling a passenger train through the countryside.
An airplane sitting on the tarmac at an airport with another plane in the background.         White and green commercial airliner taking off of runway.
The udders of a dairy cow that is standing in a pasture near a large building.        A cows ass and some buildings

Archivo de referencia

En este archivo cada línea corresponde a un score por cada par de oraciones del archivo de ejemplos. Este score representa el promedio del valor asignado por humanos. Calcular este score es que buscamos capturar.

3.5349
3.6924
0.5730
3.2319
1.2929

Archivo de resultados

Por línea de ejemplo un nùmero real entre 0 y 4 (0 a 5 para inglés), seguido de un nivel de confianza entre 0 y 100. Este archivo es el que generamos y enviamos a la organización.

1.5782        39.4795
3.7368        16.1379
0.5002        10.8984
3.0136        62.2158
4.1593        29.9327

Datos de la competencia

Inglés 2014

Español 2014

Metodologías propuestas

Instalar y correr SOPA

Reuniones

Videos

Sección en inglés

Task preparation (TODO)

Scientific

  1. Adapt the Semeval 2013 and 2014 system on the lipn-rcln server (Jorge, Iván, Davide and students).
  2. Implement Sultan's monolingual alignment algorithm (2014 winning system) at IIMAS.

Tarea alternativa ¿?

Meetings

Semeval 2015 conference