Proyectos

CARTOGRAFíA

Cartografía de la diáspora altamente calificada aplicando técnicas de minería semántica a resultados de búsquedas en la web

El proyecto busca desarrollar métodos de minería semántica de la web para cartografiar las migración altamente calificada. La hipótesis de fondo es que estos métodos podrían generar una fuente de datos muy rica para la sociología de la migración (ejemplo: ¿dónde están, qué hacen ahora los exbecarios de Conacyt? ¿cuáles son sus áreas de especialidad?). Actualmente estamos probando una línea metodológica en donde se utiliza un algoritmo de aprendizaje reforzado (reinforcement learning) sobre resultados de motores de búsqueda para extraer rastros de mobilidad que nos permitan cartografiar la trayectoria profesional de los altamente calificados.

Fondo: Ecos Nord (2016-2020)
Presupuesto: ~64k€
Instituciones participantes: LIPN, Télécom-Paristech, IRD, IIMAS/UNAM, CRIM/UNAM (México)

GOLFRED

Generación de relatos de experiencia en 1a persona para robots de servicio

Cuando un ser humano vuelve a la casa, por lo general hay otro ser humano enfrente para preguntarle: ¿cómo te fue? El objetivo del proyecto es dotar a un robot de servicio de capacidades narrativas para responder de la manera más natural posible a esta pregunta, es decir, resumir en lenguaje natural las actividades realizadas recientemente. Estos relatos de experiencia intentan transmitir, a través del soporte narrativo, una perspectiva global de las tareas realizadas por el robot, en donde se conjugue la percepción visual, la descripción de las acciones y del espacio recorrido. La plataforma experimental de este proyecto es el robot de servicio Golem-II desarrollado por el IIMAS-UNAM.

Fondo: AUF-PIRAT (2015-2016)
Presupuesto: ~11k€
Instituciones participantes: LIPN, Télécom-Paristech, IRD, IIMAS/UNAM, CRIM/UNAM (Mexique)

Publicaciones

Robot Experience Stories: first person generation of robotic task narratives in SitLog

Garcia Flores, J., Meza, I., Colin, E., Gardent, C., Gangemi, A. and Pineda, L. (2018, próxima publicación) Journal of Intelligent and Fuzzy Systems.

Cross-domain deception detection using support vector networks

Hernandez-Castañeda, A, Calvo, H., Gelbukh A. and Garcia Flores, J.J. (2017, Febrero) Soft Computing, 21(3), 585-595. doi:10.1007/s00500-016-2409-2

Blog annotation: from corpus analysis to automatic tag suggestion

Garrido-Marquez, I. Garcia Flores, J., Lévy, F. and Nazarenko, A. (2016, Abril) Research in Computing Science (CICLING 2016): Advances in Opinion Mining, Social Network Analysis, and Authorship Attribution, 110, 95-106.

Lipn-core: Semantic text similarity using n-grams, wordnet, syntactic analysis, ESA and information retrieval based features

Buscaldi, D., Le Roux, J., Garcia Flores, J.J. and Popescu, A. (2013) Second Joint Conference on Lexical and Computational Semantics (SEMEVAL 2013).

Tracking Researcher Mobility on the Web Using Snippet Semantic Analysis

Garcia Flores, J.J., Zweigenbaum, P., Yue, Z. and Turner, W. (2012) Advances in Natural Language Processing (JapTAL, 2012). Lecture Notes in Computer Science, 7614, 180-191. doi:10.1007/978-3-642-33983-7_18

más publicaciones

Código

Nombre Descripción Rol URL código fuente URL prototipo
UnoporunO Minería semántica de resultados de búsquedas web para la localización de migrantes altamente calificados líder de proyecto, programador https://github.com/rcln/unoporuno http://tal.lipn.univ-paris13.fr/unoporuno/
unoporunoDQN Prueba de concepto de un método de localización de migrantes altamente calificados a partir del web por medio de aprendizaje reforzado co-jefe de proyecto https://github.com/rcln/unoporunoDQN
cartographies sonores Cartografía sonora de idiomas del mundo (especialmente aquellos objeto de investigación en el Labex EFL) líder de proyecto https://github.com/rcln/unoporunoDQN http://tal.lipn.univ-paris13.fr/cartographies/
BNI Biblioteca digital de ideas: visualización semántico-icónica de la obra de dos filósofos co-jefe de proyecto https://github.com/rcln/bni http://tal.lipn.univ-paris13.fr/bni/
CCTV Visualización multilingüe de tópicos extraídos de Wikipedia por el método sampled min-hashing líder de proyecto https://github.com/rcln/min-hashing http://tal.lipn.univ-paris13.fr/minhashing/
Golfred Generación in vitro de relatos de experiencia para robots de servicio líder de proyecto, co-desarrollador https://github.com/rcln/golfred
SOPA-Semeval Sistema de cálculo de similaridad semántica entre dos frases basado en regresión lineal: con este participamos en SEMEVAL-STS 2013-2015 co-desarrollador https://github.com/rcln/semeval

Estudiantes y docencia

Université Paris 13, Institut Galilée
Máster en Informática orientada a datos para la toma de decisiones

Gestión de proyectos

Imparto un curso teórico-práctico de gestión de proyectos para estudiantes del Máster 1 de informática de mi universidad. Además de las clases teóricas, hay una práctica en donde un equipo de siete estudiantes desarrolla un proyecto para un cliente durante un semestre. Cada año coordino a uno o dos equipos en su proyecto de desarrollo con cliente, y en la edición 2016 el cliente estaba en un instituto de investigación mexicano. Los estudiantes de París 13 se reunieron con él por visioconferencia y dos de ellos viajaron a México para presentar su proyecto al final del ciclo.

Ivan Garrido-Marquez (doctorando, LIPN, UP13)

El tema de doctorado de Iván se enfoca al desarrollo de métodos de evaluación de la calidad de un sistema de anotación semántica, y al estudio de las dinámicas de reanotación producto de dicha evaluación. Además de desarrollar medidas de equilibrio y redundancia para evaluar un sistema de anotación, Iván trabaja en estrategias de reanotación y reequilibrio de dicha clase de sistemas. Su asesora principal es Adeline Nazarenko, y sus coasesores somos François Lévy y yo.

Josué Urbina and Carl Posthuma (Facultad de Ingeniería-IIMAS, UNAM)

Josué y Carl son dos estudiantes y futuros ingenieros informáticos de la facultad de ingeniería de la UNAM. Yo los coasesoro, junto con Ivan Vladimir Meza, en el trabajo que realizan para validar su servicio social, y que consiste en el desarrollo de un método de Deep-Q basado en redes neuronales para la clasificación de resultados de motores de búsqueda con información sobre la migración altamente calificada (proyecto CARTOGRAFíA).