Análisis multimodal de emociones y sentimientos
Dentro del marco de la red temática de tecnologías del lenguaje, proponemos la creación de un grupo de interés en detección de análisis mutilimodal de emociones y sentimientos, principalmente centrado en la extracción a partir de texto pero abierto también a otros canales paralingüísticos (notablemente el acústico y el visual).
Introducción
El análisis de emociones intenta detectar de manera automática la expresión de sentimientos, en particular ligados a opiniones o juicios a partir de diversos soportes. Si bien desde una perspectiva de tecnologías del lenguaje el eje de investigación natural toma el lenguaje escrito como materia prima, las conexiones con ejes de investigación aledaños, ligados a los modelos de diálogo y a las interacciones humano robot, son también prometedoras y reflejan el carácter interdisciplinario del panorama científico mexicano en la materia.
La investigación en análisis de sentimientos centrado en texto se ha beneficiado de un auge científico reciente, debido entre otros factores al interés por identificar automáticamente la polaridad de las opiniones expresadas en medios electrónicos (foros, blogs, redes sociales) con respecto a productos, eventos, personas o debates públicos.
Cuando el análisis de emociones se extiende más allá del lenguaje escrito se habla de detección multimodal. Los métodos multimodales toman también en cuenta características verbales y no verbales provenientes de los canales acústico y visual. Es aquí en donde el potencial interdisciplinario de la investigación es más rico, pues se pueden establecer vínculos con la computación afectiva, la robótica y las interfaces de diálogo hombre-máquina.
Hacemos énfasis en el carácter interdisciplinario de la investigación porque sería reductor centrar la propuesta solamente en el tratamiento de emociones a partir de textos, dada la diversidad de preocupaciones científicas de los equipos de investigación que integran actualmente la red de tecnologías del lenguaje. Luego entonces, estructuramos la siguiente propuesta tomando en cuenta el caracter central de la detección de emociones a partir de texto, pero con aberturas posibles a otros ejes conexos.
Grupos de investigación
- BUAP: El equipo de investigación de David Pinto cuenta con dos robots emocionales de Hanson Robotics recientemente adquiridos y cuyas aplicaciones interdisciplinarias en expresión y detección emocional podrían dar lugar a interacciones científicas fértiles con los demás equipos.
- CIC/IPN: Alexander Gelbukh y Grigori Sidorov han trabajado en minería de opiniones en Twitter así como en el desarrollo de SenticNet, un recurso semántico para el análisis de sentimientos. Hiram Calvo también se ha interesado en fechas recientes en el tema.
- IIMAS/UNAM: En el marco del proyecto Golem, Mauricio Castillo y Luis Pineda han estado trabajando en la expresión de emociones con robot. Puesto que otra línea de investigación histórica del equipo Golem está enfocada al desarrollo de modelos de diálogo, una línea de investigación prometedora sería la detección de emociones por parte del robot a partir de interacciones conversacionales, en la línea lo que se hace con el robot Nao en el LIMSI.
- CINVESTAV: Ana Maria Martinez-Enriquez ha coordinado un trabajo sobre análisis léxico de sentimientos.
- University of North Texas: La mexicana Verónica Pérez Rosas, actualmente lleva a cabo un doctorado en el grupo de LIT@UNT, que dirige Rada Mihalcea, pionera en el área de análisis de sentimientos. El trabajo de Verónica está enfocado al análisis de sentimientos multimoda. Verónica podría integrarse como colaborador externo al trabajo de la red. Un vínculo de colaboración internacional entre nuestro grupo y el LIT@UNT podría ser científicamente fértil.
Metas
El objetivo general de nuestra propuesta consiste en consolidar una comunidad de investigación que desarrolle el tema del análisis de emociones y sentimientos en México, cultivando el carácter interdisciplinario que caracteriza el panorama científico nacional en la materia. Un estudio, así sea somero, de las publicaciones producidas en México en los últimos años muestra que, por un lado, el eje de extracción de sentimientos y opiniones a partir de textos no está completamente implantado en el país, y a pesar de la calidad de algunas publicaciones, no hay un grupo de investigación de referencia en la materia a nivel nacional. Por otra parte, si debiéramos ser coherentes con la inercia científica de los potenciales participantes en el grupo, el componente de análisis multimodal (en particular aplicado a la robótica) representa una guía de orientación científica fuerte para el desarrollo del tema en el ámbito mexicano.
Los objetivos particulares se pueden declinar en el corto y el mediano plazo:
Metas a corto plazo
- Llevar a cabo reuniones mensuales de los actores científicos interesados en el desarrollo del tema.
- Invitar a referentes internacionales a animar estas reuniones con charlas científicas y meta-científicas sobre el tema.
- Definir una línea de investigación colectiva en función del interés científico y las capacidades de cada grupo.
- Publicar colectiva y colaborativamente artículos de toma de posición en el ámbito del análisis multimodal de emociones y sentimientos.
Metas a mediano plazo
- Planear un programa de recolección de fondos científicos para financiar trabajos de doctorado, quizá en un esquema de cotutela entre un laboratorio mexicano y un laboratorio extranjero de referencia en el tema.
- Buscar financiamiento y estructurar tres proyectos doctorales en los siguientes temas:
- Un doctorado en análisis y desarrollo de métodos y recursos para la extracción de emociones y sentimientos multimodales a partir de textos en lengua española. Este trabajo de doctorado podría ser coordinado por el CIC/IPN
- Un doctorado en extracción de emociones y sentimientos a partir del lenguaje hablado y las señales acústicas no verbales. Este trabajo podría ser coordinado por el IIMAS/UNAM.
- Un doctorado en extracción multimodal de emociones y sentimientos a partir de señales audiovisuales. Este trabajo podría ser coordinado por el equipo de la BUAP, quizá en cotutela internacional con algún laboratorio de tratamiento de imágenes (como el CEA-LIST francés).
Referencias
- Veronica Perez-Rosas, Rada Mihalcea, Louis-Philippe Morency, Multimodal Sentiment Analysis of Spanish Online Videos, IEEE Intelligent Systems, 2013.
- Afraz Z. Syed, Muhammad Aslam, Ana Maria Martinez-Enriquez Lexicon Based Sentiment Analysis of Urdu Text Using SentiUnits, MICAI (1), 32-43, 2010.
- Grigori Sidorov, Sabino Miranda-Jiménez, Francisco Viveros-Jiménez, Alexander Gelbukh, Noé Castro-Sánchez, Francisco Velásquez, Ismael Díaz-Rangel, Sergio Suárez-Guerra, Alejandro Treviño, Juan Gordon, Empirical Study of Machine Learning Based Approach for Opinion Mining in Tweets, MICAI (1), 2012.
- Soujanya Poria,Alexander Gelbukh,Amir Hussain,Newton Howard,Dipankar Das,Sivaji Bandyopadhyay, Enhanced SenticNet with Affective Labels for Concept-based Opinion Mining IEEE Intelligent Systems, vol. 28, issue 2, 2013.